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本 书 为 伊利 诺 伊 大 学 (UIUC) 等 众多 名 校 计算 机 科学 的 经 典 基础 教材 ， 作 者 是 与 Donald E. Knuth 
齐名 的 美国 计算 机 界 泰 斗 级 作者 Yale N. Patt。 本 书 的 目的 是 让 学 生 在 一 进入 大 学 校门 的 时 候 ， 就 对 计算 
机 科学 有 一 个 深入 理解 ,为 以 后 的 课程 打下 坚实 的 基础 。 

本 书包 括 两 方面 的 内 容 : 计算 机 底层 结构 、 高 级 语言 编程 及 编程 方法 学 。 书 中 介绍 了 LC-3 体 系 结构 
的 设计 ， 并 配套 开发 了 LC-3 模 拟 器 供 学 生 使 用 。 为 加 深 学 生 对 编程 及 其 方法 学 的 理解 ， 本 书 选 用 了 C 语 
言 作为 载体 ， 并 采用 了 “驱动 式 ” 的 自 底 向 上 方法 进行 讲解 一 一 先 给 学 生 一 个 整体 结构 ， 然 后 自 底 向 上 
地 建立 起 相关 的 知识 。 同 样 ， 在 每 个 子 单元 中 ， 也 采用 相同 的 驱动 式 教学 方法 。 在 每 个 学 习 阶 段 ， 都 在 
之 前 已 学 的 知识 的 基础 上 介绍 新 的 概念 。 经 验 告 诉 我 们 ， 这 种 学 习 方 法 更 多 地 强调 理解 而 不 是 记忆 。 通 
过 本 书 学 习 ， 学 生 的 理解 能 力 将 获得 很 大 的 提高 ， 因 为 他 们 循序 渐进 地 了 解 了 构建 计算 机 的 全 部 过 程 。 


本 书 特色 : 

e 自 底 向 上 的 组 织 ， 从 最 底层 的 MOS 晶 体 管 开 关 器 件 开 始 ， 然 后 是 逻辑 门 、 锁 存 器 、 罗 辑 结构 ( 开 
关 MUX、 译 码 器 、 全 加 器 、 门 锁 存 器 等 ) ， 最 后 使 用 这 些 单 元 来 实现 内 存 。 之 后 ， 转 至 有 限 状态 机 
控制 顺序 电路 的 实现 、 冯 … 诺 伊 曼 体 系 结构 、 一 个 简单 的 计算 机 (LC-3) ， 以 及 LC-3 的 机 器 和 
汇编 语言 、C 高 级 程序 设计 语言 、 递 归 等 ， 最 后 是 基本 数据 结构 。 

@ 调试 技术 : 从 写 第 一 个 程序 开始 ， 就 要 求学 生 采 用 LC-3 的 调试 工具 和 相关 的 调试 技术 。 正 因为 如 
此 ， 他 们 对 编程 艺术 的 体会 更 加 深刻 。 

e LC-3 模 拟 器 : 学 习 本 书 的 一 个 重要 过 程 是 亲自 操作 LC-3 模 拟 器 ， 这 是 一 个 专门 为 学 生 掌握 主要 计 
算 机 概念 而 设计 的 工具 。 学 生 可 以 从 本 书 网 站 免费 下 载 LC-3 模 拟 器 。 

e 编程 方法 学 : 本 书 给 出 了 很 多 例 程 ， 其 意义 在 于 教会 学 生 怎样 分 析 问 题 ， 并 通过 系统 的 问题 分 解 
转换 为 计算 机 可 编程 的 子 问 题 。 不 论 是 使 用 LC-3 汇 编 或 C 高 级 程序 设计 语言 ， 编 程 思路 上 都 存在 
相似 性 。 这 方面 的 理解 和 方法 对 快速 掌握 其 他 语言 都 有 帮助 。 


本 书 网 站 上 提供 了 丰富 的 辅助 阅读 材料 和 教学 资料 ， 请 感 兴趣 的 读者 到 http:/www.mhhe.com/patt2 下 载 。 
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本 书 是 计算 机 科学 的 经 典 基础 教材 。 全 书 以 自 底 向 上 方法 帮助 学 生理 解 计算 机 系统 的 原 
理 ， 前 半 部 分 阐述 了 计算 机 底层 结构 ， 后 半 部 分 讲解 了 高 级 语言 编程 及 编程 方法 学 ， 主 要 内 
容 包 括 数 据 类 型 及 其 运算 、 数 字 逻 辑 、 汉 : 诺 伊 曼 模型 、 汇 编 语言 、 输 入 和 输出 、TRAP 程 序 
和 子 程序 、C 语 言 编程 等 内 容 。 

本 书 可 用 作 高 等 院 校 计算 机 及 相关 专业 学 生 的 入 门 教材 ， 也 可 作为 的 计算 机 专业 人 士 和 
高 级 程序 员 的 参考 用 书 。 


Yale N. Patt and Sanjay J. Patel:Introduction to Computing Systems : From Bits and Gates to 
C and Beyond, Second Edition (ISBN: 0-07-246750-9). 

Original language copyright € 2004 by The McGraw-Hill Companies, Inc. 

All rights reserved. 

Simplified Chinese translation edition published by China Machine Press. 


本 书 中 文 简体 字 版 由 美国 麦 格 劳 一 希 尔 教育 出 版 公司 授权 机 械 工业 出 版 社 出 版 ， 未 经 出 版 
者 预先 书面 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 的 任何 部 分 。 
本 书 封面 贴 有 McGraw-Hill 公 司 防 伪 标 签 ， 无 标签 者 不 得 销售 。 
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Donald E. Knuth*: 有 关 Bottom-Up 的 论述 


(摘自 ; «The Art of Computer Programming) (Fascicle 1: MMX ) ) 

为 什么 还 需要 机 器 语言 ? 

许多 读者 可 能 都 很 困惑 ;“Knuth 在 替换 MIX 的 时 候 ， 为 什么 还 是 选择 了 一 个 机 器 语言 ， 
而 不 是 某 个 高 级 编程 语言 呢 ? 现在 还 有 谁 在 使 用 汇编 语言 啊 ?” 

或 许 持 这 种 观点 的 读者 是 有 他 们 的 道理 的 ， 他 们 当然 可 以 直接 跳 过 书 中 涉及 机 器 语言 的 
章节 。 但 我 仍 将 坚持 我 在 20 世 纪 60 年 代 早 期 本 书 第 1 卷 序 言 中 曾 表述 的 观点 : 

本 书 的 主要 目标 之 一 是 ; 揭示 一 个 高 层 结构 在 现实 机 器 上 的 实现 机 制 ， 而 不 是 仅仅 介绍 
使 用 它 的 方法 。 其 中 所 阐述 的 内 容 将 包括 ， 多 个 相互 关联 的 程序 之 间 的 链接 、 树 结构 、 随 机 
数 生成 、 高 精度 运算 、radix 变 换 、 数 据 封 装 、 组 合 查 找 、 递 归 等 内 容 ， 即 一 种 自 底层 逐步 向 
上 的 论述 方法 (简称 自 底 向 上 ，bottom-up)。 

在 我 的 书 中 ， 程 序 例子 都 非常 简短 ， 原 因 是 ; 我 希望 能 更 多 地 突出 关键 思想 ， 引 发 读者 
思考 。 我 要 对 那些 希望 深入 了 解 计算 机 的 读者 说 ; 了 解 底层 硬件 的 工作 原理 机 制 是 必需 的 ， 
否则 写 出 来 的 程序 必然 是 “莫名 其 妙 的 ”。 

正如 书 中 所 述 ， 软 件 的 运算 过 程 及 其 所 表现 的 输出 结果 都 将 表明 : 机 器 语言 在 有 些 场合 
是 非常 必要 的 。 

一 些 基本 算法 (如 排序 和 搜索 ) 通常 都 是 用 机 器 语言 编写 的 ， 因 为 ， 只 有 这 样 才能 保证 
最 佳 效率 。 在 它们 的 编写 中 ， 要 求 我 们 对 Cache、RAM 大 小 等 硬件 结构 有 是 够 深入 的 研究 ， 
如 内 存 访问 速度 、 流 水 、 多 发 (multi-issue) 、 后 援 缓冲 、Cache 块 大 小 等 问题 。 并 且 ， 还 要 分 
析 它 们 对 程序 运行 性 能 的 影响 ， 从 而 在 各 种 可 能 的 实现 方法 之 间作 出 权衡 和 比较 。 


© Donald E. Knuth 是 著名 的 《计算 机 程序 设计 艺术 》 (The Art of Computer Programming) 一 书 的 作者 ， 以 下 
论述 摘自 该 书 第 一 卷 “MMIX” 的 内 容 片 段 。 一 一 译 者 注 
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文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 芍 断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 间 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 痢 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 证 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

枫 械 工业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 王选 出 Tanenbaum，Stroustrup，Kernighan,， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 瞩 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 里 力 衷 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 ， 除 “计算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”， 同 时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公 司 聘请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 了 哈尔滨 工业 大 学 、 西 安 交 通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 淹 
北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 和 出 版 监督 。 | 

这 三 套 丛 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. LT., Stanford, U.C. Berkeley, C. M. U. 等 世界 
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名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工 程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 共 特 色 一 一 有 的 出 自 语 言 设 计 者 之 手 、 有 的 历经 三 十 年 而 不 训 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 和 人 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 ; 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 ，100037 
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本 书 的 翻译 工作 终于 完成 了 ， 有 机 会 翻译 Patt 教 授 的 著作 让 我 们 感到 非常 幸运 。 尽 管 
本 书 是 为 大 学 一 年 级 学 生 编写 的 计算 机 基础 教材 ， 但 作者 在 阐述 这 些 基本 概念 时 所 站 的 高 
度 和 论述 深度 都 是 无 与 伦比 的 。 我 们 几 位 译 者 都 长 期 从 事 计算 机 专业 的 教学 和 开发 ,但 看 
到 书 中 那些 我 们 “已 熟知 ”的 概念 时 ， 作 者 所 采用 的 论述 角度 和 方式 却 让 我 们 有 种 顿悟 的 
感觉 。 

Patt 教 授 在 他 的 主页 中 说 到 : 他 热爱 计算 机 教学 和 科研 ， 但 相 比 科研 ， 教 学 是 他 的 
“first love”。 鉴 于 他 在 计算 机 发 展 历程 中 的 贡献 及 在 计算 机 科学 教育 方面 的 深刻 理解 和 倾心 
投入 ， 他 被 IEEE 评 为 泰斗 级 人 物 (与 《计算 机 程序 设计 艺术 》 的 作者 Donald Knuth 齐 名 ， 全 
球 只 有 他 们 两 人 享 此 殊荣 ) 。Patt 教 授 在 计算 机 体系 结构 发 展 史 中 占有 一 席 之 位 : 他 在 芯片 集 
成 制造 方面 提出 了 WOS 概 念 (1965) ， 在 微 结 构 方 面 设计 了 HPS 结 构 (综合 了 超标 量 、 动 
态 调度 、 乱 序 执行 、 预 测 跳 转 等 多 项 高 级 技术 ) (1984) ;提出 了 著名 的 “两 级 自 适应 跳 转 
预测 ”结构 (1991)。1996 年 ， 他 被 IEEE/ACM 授 予 “ 在 微 处 理 器 的 指令 级 并 行 (LP) 和 超 
标量 设计 领域 杰出 贡献 ” 奖 。 我 们 敬仰 于 他 在 过 去 60 年 间 为 计算 机 发 展 所 做 的 杰出 贡献 ， 以 
及 他 生生 不 息 的 创新 能 力 (在 写 这 本 书 的 时 候 ， 他 正在 研究 “2009 年 的 计算 机 应 该 是 什么 样 
的 ”这 一 课题 )。 

有 关 本 书 在 教学 中 的 使 用 方法 可 参考 原 书 序言 。 作 者 在 第 1 版 前 言 中 提出 了 六 种 教学 模 
式 ， 在 第 2 版 前 言 中 又 将 其 归纳 为 三 种 教学 模式 ， 即 “一 年 级 两 个 小 学 期 全 授课 ”.、“ 一 年 级 
两 学 期 先 高 级 语言 再 回顾 深入 底层 ”"、“ 二 年 级 再 回顾 底层 ”三 种 模式 。 我 们 的 总 结 是 ， 本 
书 分 为 两 部 分 ， 前 10 章 (第 一 部 分 ) 讲述 的 是 计算 机 的 组 成 原理 ， 后 9 章 (第 二 部 分 ) 讲述 
C 语 言 。 

在 前 半 部 分 内 容 中 ， 作 者 以 开发 的 LC-3 机 器 (仿真 机 器 ) 为 背景 ,讲述 了 计算 机 的 基本 
组 成 和 实现 〈 如 运算 器 、 指 令 编 码 / 译 码 、IO) 等 。 学 生 可 以 通过 LC-3 机 器 和 汇编 器 学 习 汇 
编 ， 其 至 尝试 自己 的 机 器 设计 方法 。 

本 书 的 后 半 部 分 讲述 了 C 语 言 内 容 。 但 其 讲述 方法 与 通常 的 C 语 言 课本 完全 不 同 ， 它 在 讲 
述 C 语 言 变 量 、 指 针 、 语 句 、 数 据 结构 等 内 容 的 同时 ， 结 合 前 10 章 的 知识 ， 阐 释 了 这 些 高 级 语 
言行 为 怎样 转换 为 机 器 语言 并 运行 在 硬件 系统 中 。 其 中 ， 涉 及 很 多 长 期 困惑 程序 员 的 问题 ， 
如 函数 调用 时 栈 空间 (或 函数 帧 空间 ) 的 使 用 规则 、 给 变量 赋值 常量 的 几 种 方法 之 间 的 比较 、 
软件 中 断 指令 的 执行 过 程 等 。 此 外 ， 即 使 将 后 半 部 分 内 容 看 作 是 单纯 的 C 语 言 教材 也 无 妨 ， 它 
没有 通 篇 机 械 地 论述 C 语 言 的 语法 规则 ， 而 是 通过 简单 计算 器 、Hanoi 塔 、 排 序 等 问题 的 求解 ， 
轻松 地 讲述 了 C 谨 言 编程 的 要 点 ， 且 非常 自然 地 传授 了 C 编 译 器 的 工作 原理 、 递 归 编 程 技巧 和 
注意 事项 、 程 序 调试 的 原理 和 技术 、 数 据 结构 的 重要 性 等 “高 级 ”内 容 。 也 正如 作者 在 文中 
提 到 的 ， 在 语言 教学 中 ， 编 程 方法 学 和 实现 原理 比 编程 语法 更 为 重要 ， 前 者 传授 的 是 通过 编 
程 解决 问题 的 能 力 ， 后 者 则 可 以 通过 练习 和 自学 就 达到 熟练 。 

上 总之， 我 们 认为 本 书 的 特点 是 深信、 透彻 、 全 面 、 易 懂 。 书 中 虽然 没有 涉及 更 多 具体 、 
实际 的 技术 知识 (如 x86) ， 但 读 完 本 书后 ， 再 看 Intel 的 技术 手册 ， 你 一 定 会 体会 到 “一 通 百 
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通 ” 的 感觉 。 

最 后 ， 借 “ 译 者 序 ” 之 页 ， 对 所 有 参与 和 帮助 本 书 翻 译 的 人 们 表示 致谢 : 本 书 第 1、4、5、 
6、7、15 章 及 附录 A 由 梁 阿 磊 翻 译 ， 第 2、3、8、18、19 章 和 附录 D 及 索引 由 蒋 兴 昌 翻 译 ， 第 9、 
10、11、12、13、14、16、17 章 由 林 凌 翻译 ， 附 录 B 和 C 由 李 鸿 翻译 了 初稿 。 全 书 由 梁 阿 磊 审 
校 。 感 谢 杨建华 先生 对 本 书 部 分 章节 做 出 的 细致 而 专业 的 校对 和 翻译 建议 ， 感 谢 姜 玲 燕 对 部 
分 章节 所 做 的 细致 校对 和 修改 建议 ， 感 谢 邹 恒 明 先生 为 本 书 所 作 的 序言 。 您 现在 看 到 本 书 的 
中 文 版 ， 也 凝结 了 翻译 者 的 努力 。 我 们 尽 了 最 大 所 能 ， 试 图 将 本 书 翻 译 成 一 本 好 书 。 但 鉴于 
能 力 有 限 ， 如 有 不 足 和 错误 之 处 ， 敬 请 谅解 和 指正 。 最 后 ， 感 谢 亲 人 和 朋友 对 本 书 的 热情 期 
待 和 支持 。 


译 者 
2007 年 2 月 26 日 于 上 海 交 大 
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梁 老 师 请 我 为 本 书写 序 之 初 我 有 些 狂 入 ,原因 有 二 : 一 是 我 没有 给 书写 序 的 经 验 ， 二 是 
恐怕 自己 水 平 有 限 ， 写 的 序 不 能 充分 表述 或 突出 这 样 一 本 优秀 教材 的 独特 之 处 而 影响 该 书 的 
推广 。 不过， 在 经 过 慎重 考虑 后 ， 我 还 是 接受 了 这 个 挑战 。 凡 事 总 有 头 一 回 吧 ， 没 有 经 验 不 
是 推脱 的 理由 ， 而 且 本 人 在 密歇根 大 学 攻读 博士 学 位 的 三 年 间 耳 闻 目 睹 了 该 书 第 一 作者 Yale 
Patt 的 过 人 学 识 与 非凡 个 性 ， 随 后 在 上 海 交通 大 学 任教 的 三 年 里 又 与 本 书 的 第 一 译 者 梁 阿 震 博 
士 成 为 好 友 至 交 ， 写 起 序 来 总 会 比 不 认识 作者 和 译 者 的 人 有 些 优势 。 至 于 水 平 有 限 ， 只 能 请 
读者 包涵 了 。 

Yale Patt 曾 任 美国 密歇根 大 学 计算 机 体系 结构 实验 室 主任 多 年 ， 被 IEEPF Spectrum 称 为 美 
国 计 算 机 界 的 卓越 泰斗 (luminary)， 在 美国 乃至 世界 计算 机 体系 结构 领域 有 着 广泛 的 影响 力 。 
这 本 《计算 系统 概论 》 不 光 是 密歇根 大 学 计算 机 专业 的 经 典 基础 教材 ， 也 是 美国 多 所 知名 大 
学 ， 如 得 克 萨 斯 大 学 、 莱 斯 大 学 、 明 尼 苏 达 大 学 、 乔 治 亚 理工 学 院 、 伊 利 诺 伊 大 学 和 西北 大 
学 等 校 的 计算 机 专业 基础 教材 。 

本 书 第 一 译 者 梁 阿 舌 博 士 是 上 海 交 通 大 学 教师 ， 他 多 年 在 计算 机 教学 上 花费 的 心血 博得 了 
学 生 的 广泛 认同 ， 并 成 为 上 海 交 通 大 学 计算 机 系 和 软件 学 院 最 受 学 生 欢 迎 的 教师 之 一 。 梁 博 
士 在 翻译 本 书 过 程 中 精益 求 精 ， 既 保持 了 原著 的 精彩 曾 述 和 独特 风格 ， 又 注入 了 中 文 语言 
特有 的 内 涵 ， 使 译 著 精 辟 且 上 顺畅， 并 成 为 上 海 交 通 大 学 计算 机 及 相关 专业 学 生 的 指定 教材 。 

也 许 你 听 过 这 个 有 启示 的 故事 : 在 20 世 纪 五 六 十 年 代 时 ， 美 国 GE 公司 的 一 个 大 型 发 电机 
出 了 问题 。 所 有 的 操作 人 员 及 工程 技术 人 员 面 对 一 大 堆 的 仪表 和 旋钮 一 筹 莫 展 。 于 是 他 们 请 来 
了 一 位 这 方面 的 专家 ,这 位 专家 看 了 一 下 , 便 拿 出 一 把 螺丝 刀 , 将 一 个 旋钮 反 时 针 转 动 了 35 度 ， 
发 电机 就 正常 运转 了 。 后 来 ， 专 家 开 出 的 账单 为 1000 美 元 ，GE 觉 得 花 两 分 钟 钮 动 一 个 旋钮 就 
收取 1000 美 元 太 多 ， 便 要 求 专家 出 具 一 份 更 详细 的 说 明 。 两 天 后 ， 专 家 寄 来 了 新 的 账单 : 

将 旋钮 反 时 针 方向 转动 35 度 : 0.75 美 元 
知道 应 转动 哪个 旋钮 及 转动 幅度 : 999.25 美 元 

一 本 好 的 教科 书 不 应 只 教导 学 生 转 动 4 旋钮 35 度 ， 而 是 应 教会 学 生 为 什么 要 转动 4 旋钮 及 
为 什么 只 能 转动 不 多 不 少 的 35 度 。 这 个 例子 恰恰 能 印证 本 书 的 优点 所 在 。 

与 多 数 人 的 感觉 不 同 ， 本 书 不 仅 简单 地 讨论 计算 机 组 成 原理 或 程序 设计 语言 ， 而 是 站 在 计 
算 机 整体 系统 的 高 度 将 软 硬 件 连贯 起 来 进行 遍 述 。 本 书 强 调 的 是 理解 ， 而 不 是 死记 硬 缘 ， 强 调 
的 是 软件 与 硬件 结合 ， 而 不 是 软 硬 件 的 分 别 教授 与 学 习 。 本 书本 着 将 软件 硬件 教学 齐头并进 的 
思路 ， 从 硬件 的 基本 构件 一 直 讲 到 软件 的 高 级 程序 设计 与 构造 ， 使 学 生 在 学 习 过 程 中 能 够 将 软 
硬件 融会 贯通 、 相 互 印 证 ， 从 而 提高 学 习 的 广度 、 深 度 和 效果 ， 并 为 后 续 的 计算 机 专业 课 如 操 
作 系 统 、 计 算 机 系统 设计 与 结构 、 算 法 设计 与 分 析 、 高 可 靠 软件 工程 理论 等 打下 基础 。 

本 书 最 大 的 特点 是 其 提倡 的 层次 转换 概念 ， 即 从 问题 开始 到 计算 机 运算 出 结果 可 以 分 为 
七 个 层次 。 通 过 七 个 层次 的 转换 ， 即 可 完成 从 问题 到 结果 的 转变 。 这 七 个 层次 及 其 转换 是 ; 
问题 到 算法 的 转换 、 算 法 到 程序 设计 语言 的 转换 、 程 序 到 指令 集结 构 (ISA) 的 转换 、 指 令 集 
结构 到 微观 结构 的 转换 、 微 观 结构 到 电路 的 转换 和 电路 到 电路 组 件 的 转换 。 该 书 对 每 个 层次 
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转换 进行 了 深入 的 阐述 ， 讲 解 了 为 什么 需要 这 些 转换 以 及 没有 这 些 转换 所 带 来 的 困难 。 美 国 
多 个 大 学 的 教学 实践 表明 ， 这 种 层次 转换 的 概念 极 大 地 提高 了 学 生 对 计算 机 软 硬 件 的 理解 。 

本 书 在 结构 上 采取 的 策略 是 自 底 向 上 。 在 对 计算 机 的 哲学 原理 进行 了 简要 综述 后 ， 从 唱 
体 管 开始 ， 对 逻辑 门 、 触 发 器 、 逻 辑 结构 和 内 存 实现 分 别 进行 了 详细 的 讨论 。 在 此 基础 上 ， 
再 对 汉 . 诺 伊 曼 执行 模式 进行 剖析 、 讲 解 如 何 构 建 一 个 简单 的 LC 计算 机 。 然 后 上 升 到 软件 层 ， 
对 计算 机 汇编 语言 和 高 级 程序 设计 语言 C 进 行 讲解 ， 重 点 将 程序 语言 的 各 种 数据 类 型 和 构造 与 
底层 的 硬件 构造 联系 起 来 ， 从 而 使 学 生 在 深层 次 上 理解 程序 语言 里 各 种 构造 的 来 龙 去 脉 ， 及 
计算 机 软 硬 件 之 间 的 有 机 的 、 千 丝 万 缕 的 联系 。 

本 书 的 使 用 方式 有 多 种 ， 其 中 适合 中 国 国情 的 方式 有 以 下 四 种 ; 

1. 密 歌 根 模式 ， 作 为 计算 机 软 硬 件 原理 的 入门 教材 ， 无 需 先 修 课程 。 该 模式 要 求 一 个 学 

期 内 覆盖 本 书 全 部 内 容 ， 时 间 安 排 为 本 科 第 一 学 年 的 第 一 学 期 。 该 模式 工作 量 大 ， 挑 
战 性 高 ， 非 常 适用 于 肯 钻 研 、 进 取 心 强 的 学 生 。 

2. 正 常 模式 :作为 软 硬 件 专 业 人 门 教材 ， 无 需 先 修 课程 。 该 模式 要 求 在 一 个 学 期 覆盖 大 
部 分 内 容 ， 但 可 以 忠 过 10.3、10.4 节 、 第 16 章 、 第 18 章 和 第 19 章 。 时 间 安 排 为 本 科 第 一 
年 的 第 二 学 期 。 该 模式 较 密 吹 根 模式 来 说 负担 稍 轻 ， 但 仍 具有 相当 的 挑战 性 。 

3. 第 二 模式 ;在 学 生 已 经 进行 了 专业 入 门 教育 如 程序 设计 、 数 据 结 构 和 数字 电路 等 课程 
的 学 习 后 使 用 本 书 作为 第 二 课程 的 教材 。 这 种 模式 在 一 个 学 期 覆盖 本 书 全 部 内 容 ， 而 
讲课 时 间 则 安排 在 本 科 二 年 级 上 学 期 。 该 模式 适合 于 计算 机 专业 的 大 多 数学 生 。 

4. 分 治 模式 : 将 这 本 书 的 内 容 分 为 两 个 学 期 讲授 。 第 一 学 期 讲授 第 1~10 章 ， 第 二 学 期 讲 
授 第 11~19 章 。 时 间 安 排 为 本 科 一 年 级 下 学 期 和 二 年 级 上 学 期 ， 这 是 使 用 本 书 的 最 优 
方式 。 

EBEKRE, REER, WARE, RER, LEWD, WERA, REKI AA 
胜 ， 爱 不 释 手 。 本 书 还 引入 了 大 量 的 典故 和 比喻 (当然 ， 有 些 典 故 和 比喻 需要 西方 及 美国 文 
化 背景 才能 更 好 地 领悟) ， 让 人 感觉 到 不 是 在 读 一 本 计算 机 教科 书 ， 而 是 在 读 一 本 幽默 有 趣 的 
长 篇 小 说 ， 或 者 借用 Donald Knuth 的 话 ， 它 是 “一 部 蓝 色 的 诗歌 ”。 

本 人 强烈 推荐 本 书 给 高 校 计算 机 专业 的 师 生 和 所 有 对 计算 机 软 硬 件 有 着 浓厚 兴趣 的 人 士 。 
读 完 本 书后 ， 你 对 计算 机 系统 的 理解 将 会 达到 一 个 甸 新 的 境界 。 相 信 我 ， 你 不 会 失望 的 。 


邹 恒 明 
2007 年 3 月 2 日 于 羊 庄 


第 2 版 前 言 


本 书 自 第 ! 版 发 行 至 今 已 有 三 个 年 头 ， 期 间 我 们 收 到 了 大 量 学 生 和 教师 的 反馈 信息 ， 几 乎 
所 有 的 反馈 信息 都 是 “正面 的 "， 这 让 我 们 备 感 欣慰 ! 能 有 机 会 出 版 本 书 的 第 2 版 ， 实 在 是 让 
人 高 兴 的 一 件 事情 。 之 所 以 高 兴 ， 是 因为 大 多 数 人 都 赞 间 本 书 的 编写 方法 ， 尤 其 是 我 们 收 到 
的 反馈 信息 都 来 自学 习 第 一 线 的 读者 一 一 它们 包含 了 学 习 者 (学生) 的 感受 和 授 业 者 (教师 ) 
对 本 书 使 用 效果 的 评价 ， 从 他 们 的 E-mail 中 能 看 出 对 本 书 的 评价 都 很 高 。 

但 正如 本 书 第 1 版 前 言 中 所 提 到 的 ， 本 书 仍然 在 追求 不 断 地 完善 。 另 外 ， 在 接受 鞠 誉 的 同 
时 ， 我 们 也 收 到 很 多 建议 ， 这 些 建议 指出 怎样 使 本 书写 得 更 好 ， 我 们 在 此 向 所 有 关心 本 书 的 
读者 深 表 感谢 。 同 时 ， 由 于 第 1 版 出 版 后 我 们 两 人 都 分 别 在 课堂 上 讲 了 两 遍 以 上 ， 也 发 现 了 很 
多 需要 修改 和 改进 的 地 方 。 因 而 我 们 决定 在 第 2 版 中 做 出 较 大 的 修改 ， 但 同时 也 期 望 新 版 能 沿 
续 第 1 版 编写 的 初 囊 ， 并 期 待 尽快 听 到 读者 的 反馈 。 


修订 内 容 
LC-3 


本 版 最 大 改动 之 一 就 是 ， 采 用 LC-3 (Little Computer 3) 结构 替换 了 第 1 版 的 LC-2 机 器 模 
型 。 实 际 上 ， 新 结构 保持 了 LC-2 的 基本 概念 ， 即 一 个 易于 描述 又 有 望 在 短期 内 掌 担 的 丰富 的 
ISA。 指 令 仍 然 采 用 16 位 宽度 ， 其 中 操作 码 为 4 位 。 正 如 我 们 的 一 个 学 生 指 出 的 ， 事 实 上 , F 
程序 返回 指令 (RET) 就 是 LC-2 的 JMPR 指 令 的 特例 ， 因 而 在 LC3 中 ， 我 们 取消 了 RET 指 令 作 
为 单独 操作 码 的 定义 。 在 LC-3 中 ， 我 们 只 定义 了 15 种 操作 码 ， 预 留 了 一 个 用 于 未 来 应 用 (或 
许 在 第 3 版 中 会 定义 这 个 操作 码 )。 

其 次 ， 我 们 收 到 很 多 反对 PC-concatenate 寻 址 模式 的 建议 ， 特 别 是 针对 分 支 跳 转 指令 。 该 
寻 址 模式 起 源 于 20 世 纪 60 年 代 中 期 的 PDP-8 机 器 ， 问 题 表 现在 当前 页 中 的 一 条 指令 访问 下 一 
页 (或 之 前 页 ) 之 时 。 这 个 问题 很 让 人 头痛 ， 尤 其 是 在 接近 页 边界 时 出 现 的 前 向 跳 转 指令 。 
因而 ， 很 多 人 建议 我 们 采用 现代 机 器 中 常用 的 “PC+offset” 方 式 。 因 此 ， 我 们 将 第 1 版 中 所 有 
使 用 “PC 偏 移 (offset)” 之 处 ， 都 改 成 了 “PC+SEXT (offset)", 

另外 ， 新 版 还 包括 以 下 修改 ; 

* 栈 空间 增长 改 为 向 0 地 址 增长 (符合 现在 的 实际 惯例 )。 

* LDR/STR 指 令 中 的 偏 移 改 成 了 有 符号 值 (因而 可 以 基于 base 地 址 做 向 前 、 向 后 偏 移 )。 

。 操 作 码 1101 现 在 未 做 定义 。 

: ISR/JTMP 的 操作 码 做 了 轻微 改动 。 

。 最 后 ， 条 件 码 扩展 为 16 位 处 理 器 状态 寄存 器 (Processor Status Register, PSR， 其 中 包含 

了 特权 模式 和 优先 级 字段 ) 。 
与 第 1 版 相同 ， 在 附录 A 中 有 LC-3 结 构 的 完整 描述 。 


扩充 内 容 
在 第 1 版 的 基础 上 ,新 版 几乎 对 所 有 章节 都 做 了 或 多 或 少 的 修改 ， 有 些 章节 的 改动 大 一 些 。 
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其 中 : 
* 第 1 章 中 增加 了 两 方面 的 内 容 (1) 有 关 抽象 方法 的 重要 性 及 其 本 质 性 的 描述 ，(2) 硬件 
和 软件 之 间 相 关 性 的 讨论 。 
“第 3 章 增 加 了 一 节 ， 即 有 关 有 限 状 态 控制 及 顺序 开关 控制 的 实现 方法 。 因 为 这 些 实现 方 
法 和 技巧 已 成 为 计算 机 科学 (CS) 或 计算 机 工程 (CE) 专业 学 生 必 须 掌握 的 知识 ， 这 
些 知识 的 掌握 将 有 助 于 对 第 4 章 冯 “ 诺 伊 曼 模 型 的 深入 理解 。 
。 第 4 章 中 增加 了 对 LC-3 微 结构 的 概述 ， 相 关内 容 的 详细 描述 参见 附录 C。 
“第 5 章 ， 有 读者 反映 内 容 太 扼要 ， 在 此 我 们 增加 了 一 些 素材 ， 希 望 新 增 的 这 些 图 和 注释 
会 使 相关 概念 更 加 清晰 。 
“第 8 章 和 第 10 章 中 增加 了 有 关中 断 驱动 IO 的 章节 内 容 。 
“第 11~14 章 介绍 了 C 语 言 〈 与 第 1 版 一 样 )， 不 同 之 处 是 ， 这 些 章节 更 加 注重 帮助 编程 初 
学 者 掌握 语言 的 基本 内 容 ， 而 将 那些 特性 内 容 移 至 该 章 结尾 或 附录 D 之 中 ， 使 之 脱离 救 
材 的 主线 。 所 有 这 些 章节 都 增加 了 更 多 的 例子 。 
另外 ， 第 2 版 改 用 “问题 解决 驱动 ”方式 来 讲述 编程 技术 ， 即 通过 例子 展示 为 什么 新 引入 的 
C 结 构 可 以 在 C 编 程 中 解决 当前 的 问题 (这 将 有 助 于 读者 真正 理解 编程 语言 的 设计 精妙 之 处 ) 。 
“第 14 章 中 还 将 介绍 新 的 LC-3 调 用 规范 ， 新 的 规范 更 接近 实际 系统 中 所 采用 的 规范 。 
“第 15 章 介绍 了 有 关 测 试 和 调试 的 深入 知识 。 
。 章 节 顺 序 的 调整 : 根据 来 自 教学 中 的 经 验 ， 我 们 决定 调换 “递归 ”和 “指针 与 数组 ”两 
章 的 硕 序 。 从 而 使 学 生 在 学 习 “ 递 归 ” 内 容 (相对 较 难 ， 目 前 推 后 至 第 17 章 ) 之 前 有 更 
多 的 机 会 熟悉 和 掌握 C 语 言 的 编程 方法 。 


仿真 器 


针对 新 的 LC-3 结 构 ，Brian Hartman 对 原先 的 Windows 版 仿真 器 (Simulator) 做 了 修正 。 
Ashley Wise 则 为 UNIX 平 台 编 写 了 LC-3 仿 真 器 。 在 两 个 版 本 的 仿真 器 中 ， 都 实现 了 “中 断 驱 
动 O” 功 能 。 我 们 相信 没有 任何 方法 比 “ 实 际 动 手 ” 更 有 助 于 知识 的 真正 掌握 。 具 备 了 中 断 
驱动 IO 功能 的 仿真 器 ， 使 得 学 生 现 在 可 以 实验 这 样 一 个 场景 ， 即 通过 键盘 输入 中 断 一 个 正在 
执行 的 程序 ， 并 调用 对 应 的 中 断 服务 程序 。 


本 书 的 使 用 方法 


本 书 是 计算 科学 相关 专业 新 生 的 人 门 教材 。 我 们 认为 “ 自 底 向 上 ”方法 是 帮助 学 生理 解 
技术 计算 原理 的 最 好 方法 (参考 后 面 第 1 版 前 言 中 的 详细 论述 )。 事 实 和 经 验 表 明 ， 学 生 在 掌 
担 了 计算 机 底层 工作 的 原理 机 制 之 后 ， 能 更 加 从 容 地 解决 以 后 可 能 面临 的 新 问题 ， 包 括 高 级 
编程 语言 方面 的 问题 。 而 且 ， 这些 学 生 学 习 编 程 语言 的 方法 是 “理解 式 ” 而 不 是 “记忆 式 ” 
的 ， 因 为 一 切 动作 都 是 明明 白白 的 。 从 我 们 的 角度 来 看 ， 本 书 的 最 佳 使 用 方法 是 ， 开 设 一 个 
学 期 的 新 生 主 干 课 程 ， 或 是 两 个 学 期 的 课程 (节奏 慢 些 )。 如 果 教 学 的 重点 是 单 学 期 制 的 高 级 
编程 语言 ， 则 串 行 机 和 中 断 驱 动 1/O 的 内 容 可 以 中 过 ， 而 如 果 教 学 的 重点 是 本 书 的 前 半 部 分 ， 
则 第 15、17、18 和 19 章 的 内 容 可 以 跳 过 。 

通常 ， 这 本 书 的 参考 使 用 方法 包括 : 

。 一 年 级 第 一 学 期 作为 新 生 主干 课程 。 

第 一 种 方法 是 在 一 年 级 第 一 学 期 内 分 两 个 小 学 期 完成 ， 这 可 能 是 本 书 最 好 的 使 用 方法 。 
在 第 一 个 小 学 期 ， 讲 授 本 书 的 第 1~10 章 ， 在 第 二 个 小 学 期 ， 讲 授 第 11~19 章 。 这 样 的 进度 有 些 
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快 ， 但 在 两 个 小 学 期 〈 即 一 学 期 ) 内 是 可 以 讲解 完整 本 书 的 GE: 一 个 学 期 (semester) 分 为 
两 个 小 学 期 (quarter) ) 。 

。 一 年 级 第 二 学 期 作为 计算 机 的 第 二 门 课程 。 

第 二 种 方法 还 可 作为 计算 的 第 二 门 课程 在 一 年 级 第 二 学 期 完成 ， 学 生 在 之 前 的 第 一 学 期 
已 修 完了 第 一 门 高 级 编程 语言 方面 的 课程 ， 之 后 在 这 门 课程 中 ， 则 回头 学 习 初 级 的 数字 逻辑 、 
基本 的 计算 机 组 成 和 汇编 语言 编程 等 底层 知识 。 这 种 方式 下 ， 这 一 学 期 的 大 部 分 时 间 都 用 于 
学 习 第 1~10 章 ， 只 留 下 最 后 几 周 学 习 第 11~19 章 的 一 些 课题 ， 以 显示 学 生 从 第 一 门 高 级 程序 设 
计 语言 课程 中 学 到 的 机 理 是 如 何在 底层 实现 的 。 其 中 ， 通 常会 讲 到 函数 、 活 动 记录 、 递 归 、 
指针 变量 和 其 他 基本 数据 结构 等 课题 。 

， 二 年 级 计算 机 组 成 课程 (Sophomore-Level), 

本 书 还 可 用 于 二 年 级 要 上 的 深入 探究 计算 机 实现 的 课程 。 在 这 期 间 ， 重 点 学 习 第 1~10 章 ， 
有 时 还 需 彻底 学 习 附 录 C (LC-3 之 微 结构 和 微 编 程 实现 )。 需 要 指出 的 是 ， 本 书 未 讲述 计算 机 
体系 结构 中 的 一 些 重 要 概念 ， 如 高 速 缓存 、 流 水 线 、 虚 拟 存储 器 等 。 我 们 认同 这 些 概念 对 于 
有 志 成 为 计算 机 科学 家 或 计算 机 工程 师 的 学 生 至 关 重 要 ， 但 同时 又 感到 这 些 内 容 更 适合 放 到 
计算 机 体系 结构 与 设计 的 更 高 级 课程 中 来 讲 。 本 书 的 目的 并 不 在 此 。 
致谢 

本 书 需 要 向 太 多 的 人 表示 致谢 ， 感 谢 他 们 为 本 书 所 做 的 重要 贡献 。 其 中 ， 尤 其 要 感谢 
Brian Hartman 和 Matt Starolís, 

Brian Hartman 先 生 以 他 的 积极 热情 和 技术 专长 继续 为 本 书 新 版 做 出 重要 贡献 . 1996 年 冬 ， 
他 在 密歇根 大 学 作为 一 年 级 本 科 生 选修 了 这 门 课 。 他 随后 在 本 科 期 间 多 次 担任 这 门 课 的 助教 ， 
并 在 硕士 学 习 期 间 编 写 开发 了 Windows 版 LC-2 仿 真 器 (同时 这 也 是 他 的 硕士 毕业 课题 ) 。 最 
近 ， 他 又 为 LC-3 开 发 了 Windows 版 仿真 器 。 现 在 ， 他 已 离开 学 校 三 年 多 了 ， 但 仍 在 坚持 维护 

Matt Starolis 在 两 年 前 作为 UT (得 克 萨 斯 大 学 ) 一 年 级 学 生 选 修了 该 课程 ， 并 于 去 年 秋季 
担任 该 课程 助教 ， 在 本 书 第 2 版 的 编写 中 担任 了 重要 角色 ， 为 本 书 提出 了 许多 意见 并 设计 了 书 
中 的 多 幅 播 图 。 他 还 修订 了 LC-3 仿 真 器 的 使 用 手册 ， 以 使 之 与 新 版 仿真 器 一 致 。 往往 在 任何 
事情 需要 有 人 去 做 的 时 候 ， 他 总 是 第 一 个 站 出 来 。 他 的 热情 为 本 书 注入 了 活力 。 

目前 本 书 有 大 约 100 多 位 采用 者 ， 我 们 定期 地 收 到 来 自 世 界 各 地 的 教授 们 热情 洋溢 的 
E-mail。 他 们 是 Vijay Pai (Rice), Richard Johnson (Western New Mexico), Tore Larsen 
(Tromso), Greg Byrd (NC State), Walid Najjar (UC Riverside), Sean Joyce (Heidelberg 
College). James Boettler (South Carolina State), Steven Zeltmann (Arkansas), Mike 
McGregor (Alberta), David Lilja (Minnesota), Eric Thompson (Colorado Denver), Brad 
Hutchings (Brigham Young), 

至 于 我 们 两 人 ， 自 第 1 版 出 版 以 来 ， 共 使 用 本 书 教授 了 4 届 学 生 ， 并 培养 了 一 大 批 热情 、 
积极 的 助教 和 学 生 。 其 中 ， 助 教 包 括 Kathy Buckheit, Mustafa Erwa, Joseph Grzywacz, 
Chandresh Jain, Kevin Major, Onur Mutlu, Moinuddin Qureshi, Kapil Sachdeva, Russell 
Schreiber, Paroma Sen, Santhosh Srinath, Kameswar Subramaniam, David Thompson, 
Francis Tseng, Brian Ward, Kevin Woley, 而 Linda Bigelow, Matt Starolis, Lester Guillory 


等 人 一 开始 都 是 新 生 ， 两 年 后 已 成 为 最 积极 的 助教 。 
Ashley Wise 开 发 了 Linux 版 本 的 LC-3 仿 真 器 ，Ajay 移 植 了 LCC 编 译 器 来 产生 LC-3 代 码 。 
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Gregory Muthler 和 Francesco Spadini 对 本 书后 半 部 分 的 原稿 提出 了 积极 的 反馈 意见 。Brian 
Fahs 为 习题 提供 了 解答 。 

Kathy Buckheit 编 写 了 LC-2 仿 真 器 的 入 门 材料 (因为 她 觉得 这 很 有 必要 )。 

得 克 萨 斯 大 学 (University of Texas) 许多 同仁 都 采用 了 本 书 ， 并 与 我 们 分 享 他 们 的 见解 ， 
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第 1 版 前 言 


本 书 内 容 取 自 密 软 根 大 学 开设 的 EECS100 课 程 一 -这 是 计算 机 科学 (CS), HAMILE 
(CE) 和 电子 工程 (EE) 三 个 专业 的 第 一 门 计 算 机 类 主 修 课程 。 该 课程 由 Kevin Compton 教 授 
和 本 书 第 一 作者 于 1995 年 秋季 开设 。 

之 所 以 开设 EECS100， 是 因为 多 年 来 计算 机 科学 与 工程 系 的 教师 认为 ， 他 们 的 本 科 生 对 
计算 机 基本 概念 缺乏 深入 的 理解 。 例 如 ， 学 生 们 无 法 清楚 地 解释 指针 变量 ， 而 递归 概念 对 他 
们 来 说 就 像 是 在 “ 变 魔 术 ”， 难 以 理解 。 

所 以 ， 我 们 在 1993 年 提出 对 传统 教学 思路 的 改革 。 传 统 的 教学 思路 是 从 高 级 计算 机 语言 
开始 人 手 ， 但 是 在 这 种 教学 方式 下 ， 学 生 仅仅 是 “ 记 住 ”了 其 中 的 技术 细节 ， 并 不 能 真正 
“理解 ”其 原理 、 机 制 。 本 书 的 教学 思路 是 “ 自 底 向 上 ”(bottom-up)， 从 MOS 晶 体 管 开始 ， 
依次 介绍 逻辑 门 、 锁 存 器 、 各 种 逻辑 结构 (如 MUX、 解 码 器 、 加 法 器 、 门 控 锁 存 器 ) ， 然 后 
通过 存储 器 (或 内 存 ) 的 实现 案例 ， 将 以 上 概念 有 机 结合 。 随 后 ， 介 绍 冯 : 诺 伊 曼 模 型 ， 并 
以 简单 的 LC-2 计 算 机 为 背景 ， 介 绍 LC-2 机 器 语言 编程 和 汇编 语言 编程 ， 再 之 后 ， 我 们 继续 上 
升 到 高 级 语言 (如 C 语 言 ) ， 以 及 递归 、 指 针 、 数 组 等 概念 ， 最 后 ， 引 人 和 人 一些 基 本 的 数据 结构 。 

有 一 种 “信息 隐藏 ”(Information Hiding) 学 习 方 法 ， 但 我 们 不 太 赞 同 这 种 方法 。 事 实 上 ， 
“信息 隐藏 ”确实 是 个 很 有 效 的 学 习 方 法 96。 但 我 们 认为 ， 只 有 在 你 真正 搞 明 白 它 在 做 什么 之 
后 ， 信 息 隐 藏 方法 才 具 有 意义 。 换 句 话说， 我 们 计划 将 每 个 概念 的 底层 动作 都 暴露 、 表 现 出 
来 ， 消 除 在 上 层 感受 到 的 神秘 感 。 

需要 指出 的 是 ， 虽 然 本 书 采 用 的 是 “ 自 底 向 上 ”方法 ， 但 并 不 意味 着 我 们 反对 “ 自 顶 向 
F” (top-down) 方法 。 相 反 ， 我 们 认为 “ 自 顶 向 下 ”在 设计 方面 是 非常 正确 的 方法 。 在 设计 
中 采用 的 方法 ， 与 在 学 习 中 采用 什么 样 的 方法 ， 是 两 件 不 同 的 事情 。 就 是 说 ， 对 前 者 我 们 主 
张 采用 “ 自 顶 向 下 ”方法 (前提 是 设计 者 已 深入 理解 底层 构造 ) ， 而 对 后 者 ( 即 学 习 和 理解 过 
f) 我 们 则 主张 “ 自 底 向 上 ”方法 。 

内 容 概要 

本 书 内 容 包 括 两 个 部 分 : 一 是 计算 机 底层 结构 (LC-2 计 算 机 ) ， 二 是 高 级 语言 编程 (C 
语言 ) 。 
LC-2 

本 书 的 前 半 部 分 偏重 计算 机 底层 机 制 。 从 底层 基础 知识 开始 ， 逐 步 上 升 到 操作 系统 和 高 
级 语言 程序 的 接口 层 ， 以 便 能 够 理解 真实 计算 机 的 工作 原理 。 

。 第 2 章 : 介绍 基于 位 (bit) 的 算术 和 逻辑 运算 操作 ， 以 及 相关 的 结构 设计 ( 即 LC-2 计 算 


机 的 组 成 )。 
* 第 3 章 : 存储 器 设计 。 从 MOS 晶 体 管 开始 ， 逐 步 介绍 存储 器 的 实现 过 程 。 该 存储 器 很 简 


O ”所谓 “信息 隐藏 ”方法 ， 即 在 学 习 新 概念 时 ， 不 要 过 分 追究 细节 。 一 译 者 注 
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单 ， 每 字 宽 度 为 3-bit， 共 4 个 字 大 小 〈 而 不 是 64MB ) 。 其 中 ， 每 个 部 件 的 设计 图 都 不 超 
过 一 页 大 小 (以 方便 阅读 )。 至 此 ， 构 建 存储 器 所 要 求 的 知识 就 全 部 介绍 完了 。 

第 4 章 和 第 5 章 ， MAD . 诺 伊 曼 模 型 及 LC-2 计 算 机 的 组 成 结构 。LC-2 是 一 个 16-bit 结 构 
的 计算 机 ， 也 是 汉 : 诺 伊 坚 模型 的 一 个 具体 实现 。 它 具备 以 下 功能 和 特性 : 

= 键盘 和 显示 器 等 物理 IO 设备 。 

"调用 操作 系统 服务 的 TRAP 机 制 。 

"基于 N、Z、P 等 条 件 码 的 条 件 跳 转 。 

。 子 程序 调用 和 返回 机 制 。 

“基本 的 操作 指令 集合 (ADD、AND 和 NOT) 。 

= 各 种 加 载 (load) 和 存储 (store) 寻 址 模式 ， 如 直接 、 间 接 、 基 址 + 偏 移 和 立即 数 等 有 
效 地址 计算 方式 。 

第 6 章 ， 介绍 编程 方法 学 和 调试 方面 的 知识 。 

第 7 章 : 介绍 汇编 语言 编程 ， 以 及 我 们 开发 的 LC-2 优 真 器 和 汇编 器 。 事 实 上， 我 们 开发 
了 两 个 版 本 的 仿真 器 ， 一 个 是 在 Windows 平 台 上 运行 ， 另 一 个 是 在 UNIX 平 台 上 运行 。 
Windows 版 本 的 仿真 器 程序 可 以 从 网 上 下 载 或 从 本 书 光 盘 获 取 ， 偏 好 UNIX 的 同学 ， 可 
从 网 上 免费 下 载 UNIX 版 仿真 器 ， 然 后 安装 。 

学 生 使 用 仿真 器 的 目的 是 测试 和 调试 用 LC-2 机 器 语言 和 LC-2 汇 编 语 言 编 写 的 程序 。 它 支 
持 在 线 调试 〈 即 内 存 检查 、 单 步 、 断 点 设置 等 操作 ) 。 该 仿真 器 仅 适 合 于 调试 简单 的 LC-2 机 器 
语言 或 汇编 语言 程序 ， 其 主要 目的 是 帮助 学 生理 解 和 掌握 第 1~10 章 中 的 基本 概念 。 

有 关 汇 编 语 言 ， 我 们 仅 限 于 介绍 ， 而 不 是 熟练 编程 。 汇 编 的 编程 技术 是 更 高 级 课程 (而 不 
是 一 年 级 课程 ) 的 任务 。 之 所 以 在 第 7 章 介 绍 汇 编 语言 知识 ， 是 因为 它 在 “ 自 底 向 上 ”层次 中 
独占 一 层 。 通 过 它 ， 学 生 可 以 观察 到 从 汇编 语言 到 0/1 序 列 的 转换 过 程 。 并 且 ， 通 过 手工 汇编 
《 即 手工 转换 ) ， 虽 然 花费 了 大 量 时 间 ， 但 必 将 为 学 生 打 下 坚实 的 概念 基础 ， 令 他 们 受益 终生 。 

所 谓 汇编 语言 ， 可 以 将 它 看 做 是 机 器 指令 的 一 种 “友好 ”表示 方式 ， 它 的 好 处 在 本 书后 
半 部 分 将 体现 出 来 。 因 为 从 第 11 章 开始 ， 我 们 将 借用 汇编 语言 或 机 器 语言 来 解释 C 语 言语 名 的 
底层 含义 。 当 然 ， 汇 编 语句 “ADD R1,R2,R3” 显 然 比 机 器 代码 “0001001010000011” 具 有 更 
好 的 可 读 性 。 

。 第 8 章 ， 讨论 物理 设备 的 输入 (键盘 ) 和 输出 (显示 器 )。 

。 第 9 章 : 讨论 操作 系统 的 陷 人 机 制 (TRAP) ， 以 及 子 程序 调用 和 返回 机 制 。 学 生 将 学 习 

用 LC-2 代 码 编写 的 操作 系统 服务 程序 ， 以 便 生 成 由 TRAP 指 令 调 用 的 物理 IO。 
。 第 10 章 : 是 本 书 上 半 部 分 的 总 结 。 通 过 “计算 器 程序 ”例子 ， 讲 述 栈 和 数据 转换 的 原 
理 和 机 制 。 该 程序 由 1 个 主 程序 和 1 个 子 程序 组 成 。 
C 语 言 

本 书 下 半 部 分 内 容 是 C 语 言 编程 ， 但 不 是 对 于 C 语 言 的 一 般 性 介绍 ， 而 是 对 其 内 部 机 制 的 
深入 洞察 (学 生 之 前 已 对 C 语 言 底层 有 所 了 解 )。 

作为 一 种 高 级 语言 ，C 语 言 最 适合 于 我 们 的 “ 自 底 向 上 ”方法 ， 因 为 C 语 言 是 各 种 高 级 语 
言 中 “最 低级 的 "。 通 过 它 ， 能 够 清晰 地 表现 软件 和 硬件 的 接口 关系 。 本 书 的 C 语 言 学 习 内 容 ， 
着 重 于 控制 结构 语句 、 函 数 、 数 组 等 基本 概念 ， 在 基本 掌握 编程 概念 之 后 ， 高 级 概念 (如 对 


象 、 抽 象 等 ) 的 学 习 就 是 轻而易举 的 事情 了 。 
在 学 习 过 程 中 ， 每 介绍 一 个 C 语 言 结构 ， 我 们 都 将 给 出 其 对 应 的 LC-2 汇 编 代 码 ( 即 编译 
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器 对 高 级 语言 的 处 理 结果 ) 。 在 此 ， 各 种 C 结 构 内 容 包 括 : 基本 结构 (变量 、 运 算 符 、 控 制 语 
句 和 函数 ) 、 指 针 、 递 归 、 数 组 、 结 构 、LO 操 作 、 复 杂 数 据 结构 和 动态 分 配 等 。 

BID: 高 级 编程 语言 概述 。 本 章 将 通过 一 个 简单 的 C 程 序 , 作为 学 习 C 语 言 的 “项 门 砖 ”。 
学 生 之 前 学 习 的 汇编 技术 ， 将 有 助 于 对 高 级 语言 要 素 背 后 动机 的 理解 。 

。 第 12、13 章 : 这 两 章 是 对 C 语 言 的 系统 介绍 。 其 中 ， 第 12 章 涉及 数值 、 变 量 、 常 数 、 运 
算 符 等 概念 。 第 13 章 引入 C 语 言 的 控制 结构 。 在 此 ， 我 们 给 出 了 很 多 例子 ， 以 讲解 这 些 
概念 的 灵活 用 法 。 同 时 ， 还 将 辅 以 LC-2 代 码 ， 讲 解 C 语 言 概念 与 底层 机 器 之 间 的 关联 。 

。 第 14 章 : 介绍 高 级 语言 源 代码 的 调试 技术 9。 

。 第 15 章 : 介绍 C 语 言 的 “函数 ”概念 S。 但 本 书 中 的 重点 不 仅 是 语法 层面 的 介绍 ， 更 
要 的 是 其 运行 时 原理 的 描述 。 如 栈 空间 运行 时 的 变化 过 程 。 
* S168. 讲述 “递归 ”技术 。 它 涉及 之 前 学 过 的 函数 、 活 动 记录 、 运 行 时 栈 空间 等 


概念 。 

。 第 17 章 ， 指针 和 数组 S。 理 解 这 两 个 概念 之 间 微 妙 区 别 的 要 点 在 于 对 内 存 结构 的 深入 

理解 。 

。 第 18 章 ; 介绍 C 语 言 /O 函 数 的 技术 细节 ， 包 括 : 流 、 可 变 长 参数 ， 以 及 C 语 言 通过 各 种 

“格式 ” (format specification). 控制 VO 的 效果 (参考 第 8 章 )。 
。 第 19 章 : C 语 言 的 总 结 。 并 引出 结构 、 动 态 内 存 分 配 和 链表 等 概念 。 

本 书 不 仅 介绍 各 种 概念 和 定义 ， 同 时 也 注重 培养 良好 的 编程 风格 和 方法 学 ， 这 一 点 体现 
在 本 书 的 各 个 例子 代码 中 。 通 过 这 些 例子 ， 可 以 加 深 初 级 程序 员 对 基本 概念 的 深入 理解 。 

我 们 在 教学 过 程 中 发 现 ， 学 生 对 “指针 变量 ”的 理解 毫 不 费力 ， 这 让 我 们 非常 意外 。 这 
或 许 就 是 本 书 教学 方法 的 效果 ， 因 为 之 前 他 们 已 了 解 内 存 的 概念 及 其 逻辑 设计 和 实现 机 制 ， 
所 以 能 迅速 理解 地 址 和 数据 之 间 的 差异 。 

“递归 ”是 个 难以 人 掌 担 的 概念 。 但 在 学 习 “ 递 归 ” 概 念 时 ， 理 解 “递归 ”所 需 的 基础 知识 
都 已 具备 。 如 : 子 程序 调用 /返回 时 的 栈 变化 〈 第 10 章 ) 、 被 调用 者 (called 或 callee) 和 调用 者 
(caller) 之 间 的 链接 方法 等 ， 然 后 引入 运行 时 活动 记录 、 参 数 传递 、 动 态 声明 等 概念 就 比较 
容易 了 。 换 句 话 说 ， 如 果 你 能 够 理解 一 个 函数 是 怎样 调用 另 一 个 函数 的 ， 那 么 一 个 函数 调用 
它 自己 的 过 程 ( 即 递归) 也 就 不 言 而 喻 了 。 

本 书 的 教学 方法 

在 过 去 的 两 年 里 ， 我 们 研究 了 多 种 基于 本 书 的 教学 方法 。 下 面 推荐 六 种 教学 方式 。 

(1) dEGRX GERE AX: 在 该 校 ， 它 是 本 科 入 学 的 第 一 门 课程 。 在 不 需要 任何 预备 知识 的 
情况 下 ， 集 中 讲解 全 书 内 容 。 我 们 发 现 这 种 模式 特别 适合 那些 有 天 分 的 、 爱 动脑 筋 
的 同学 。 

(2) 一 般 模式 ， 第 一 门 课程 ， 不 需要 预备 知识 。 仍 然 是 集中 讲解 ， 但 略 过 个 别 章节 ， 如 10.3 
节 、10.4 节 以 及 第 16 章 (递归 )、 第 18 章 (C 语 言 的 VO 细节 ) 和 第 19 章 (数据 结构 )。 

(3) 第 二 门 课 模式 : 很 多 学 校 认为 这 种 模式 效果 较 好 ， 即 在 第 一 门 课 中 先 学 习 “ 面 向 对 
象 编程 语言 ” ， 然 后 在 第 二 门 课 中 学 习 本 书 。 在 这 种 模式 中 ， 学 期 的 前 2/3 时 间 蚌 本 


日 ”在 新 版 中 ， 这 部 分 内 容 放 到 了 第 15 章 。 一 一 译 者 注 
日 ”在 新 版 中 ， 这 部 分 内 容 放 到 了 第 14 章 。 一 一 译 者 注 
& ”在 新 版 中 ， 这 部 分 内 容 放 到 了 第 17 章 。 一 一 译 者 注 
加 在 新 版 中 ， 这 部 分 内 容 放 到 了 第 16 章 。 一 一 译 者 注 
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书 的 前 10 章 内 容 ， 后 1/3 时 间 是 本 书 的 第 二 部 分 内 容 。 由 于 学 生 在 之 前 已 对 编程 有 所 
了 解 ， 所 以 后 半 部 分 内 容 的 学 习 将 结合 编程 大 作业 (project) 来 完成 。 这 种 模式 的 
特点 是 ， 先 学 “面向 对 象 语言 ， 然 后 反 过 来 学 习 C 语 言 ， 以 便 为 后 面 的 高 级 软件 课 
程 (如 操作 系统 ) 学 习 做 好 准备 。 

(4) 两 个 小 学 期 模式 : 这 是 一 种 非常 好 的 模式 。 无 需 预备 知识 ， 在 两 个 小 学 期 内 完成 全 
书 。 第 一 个 小 学 期 内 完成 第 1~10 章 ， 第 二 个 小 学 期 内 完成 第 11~19 章 。 

(5) 两 个 大 学 期 模式 : 这 可 能 是 最 优 模式 了 。 即 花费 一 个 学 年 的 两 个 学 期 ， 无 需 预备 知 
识 。 第 一 学 期 完成 前 10 章 和 附录 C (LC-2 的 微 结构 ) , 第 二 学 期 完成 第 11~19 章 。 课 
程 中 配合 大 量 与 编程 相关 的 课程 设计 ， 促 进 学 生 巩 固 课 党 知识 。 

(6) 二 年 级 硬件 课程 : 个 别 大 学 采用 这 种 模式 ， 其 目的 在 于 让 二 年 级 学 生 加 深 对 硬件 知 
识 理解 。 他 们 计划 在 一 个 学 期 内 ， 让 学 生 掌 握 “ 数 ”(number) 的 系统 定义 、 数 字 罗 
辑 、 计 算 机 组 织 、 机 器 语言 和 汇编 ， 最 后 以 栈 、 活 动 记录 、 递 归 和 链表 等 概念 结束 。 
其 思路 是 ， 将 本 课程 的 前 半 部 分 内 容 与 一 年 级 所 学 的 编程 课程 有 机 结合 ， 以 回顾 编 
程 课程 中 遗留 下 的 概念 问题 。 虽 然 ， 我 们 的 建议 是 将 本 书 的 授课 时 间 安 排 在 “面向 
对 象 语言 ”课程 之 前 ， 但 这 种 方法 收 到 的 效果 也 很 好 。 因 为 学 生 在 之 前 的 一 年 级 纺 
程 学 习 中 曾 遇 到 并 遗留 下 的 很 多 概念 上 的 问题 在 本 课程 中 都 将 找到 答案 ， 从 而 起 到 
“BATFE AR. 


经 验 与 体会 
理解 而 不 是 记忆 


由 于 本 课程 的 学 习 方 法 是 “ 自 底 向 上 ”， 所 以 不 存在 编程 课程 所 面临 的 “规则 ”记忆 。 这 
是 因为 按照 本 书 的 知识 结构 ， 在 接触 新 概念 之 前 ， 与 之 相关 的 底层 实现 机 制 必然 都 已 学 过 。 
另外 ， 这 种 “ 自 底 向 上 ”的 方法 对 以 后 设计 类 课程 的 学 习 也 非常 有 益 。 因 为 如 何在 多 种 设计 
方案 中 做 出 正确 的 权衡 和 决策 ， 完 全 取决 于 你 对 问题 的 理解 和 洞察 深度 。 


自己 动手 


我 们 经 常 听 到 工业 界 抱怨 :“ 计 算 机 专业 毕业 的 学 生 不 慌 得 编程 ”"。 然 而 ， 造 成 这 种 现象 
的 部 分 原因 ， 况 然 是 “热心 ”的 助教 。 因 为 ， 他 们 将 “实验 ”准备 得 太 充分 了 ， 以 至 于 学 生 
不 费力 气 就 能 完成 题目 ， 从 而 失去 了 对 编程 过 程 和 艺术 的 “体会 "。 我 们 所 要 求 的 是 ， 学 生 必 
须 在 没有 助教 帮助 的 情况 下 ， 尽 可 能 独立 地 完成 编程 任务 。 当 然 ， 我 们 之 所 以 敢 这 么 要 求 ， 
原因 在 于 : (0) 本 书 所 采用 的 “ 自 底 向 上 ”方法 给 予 学 生 的 是 “理解 ”而 不 是 “ 记 亿 ”， (2) 
本 书 配套 的 仿真 器 工具 ， 学 生 从 第 一 天 学 习 开 始 ， 就 要 使 用 它 ， 并 用 它 来 调试 程序 。 这 种 学 
习 顺 序 的 安排 ， 以 及 基于 仿真 器 的 编程 调试 经 验 ， 培 养 了 学 生 通 过 分 析 和 实验 方法 来 解决 问 
题 的 能 力 〈 而 不 是 一 味 地 求助 于 助教 ， 即 由 助教 完成 程序 的 编写 工作 )。 


为 未 来 做 准备 :深入 底层 
计算 机 专业 人 士 都 有 这 样 的 体会 ， 即 系统 运行 的 性 能 不 仅仅 取决 于 他 们 编号 程序 的 水 平 。 
缺乏 对 系统 底层 知识 的 了 解 ， 使 得 他 们 面 对 一 些 性 能 问题 时 一 筹 莫 展 。 这 种 情况 很 多 ， 其 中 


不 乏 资 深 程序 员 和 工程 师 。 
作为 高 级 程序 员 ， 要 编写 高 效率 代码 ， 仅 仅 掌握 高 级 语言 本 身 是 不 够 的 。 除 此 之 外 ， 他 
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们 还 需要 了 解 与 设备 相关 的 知识 (甚至 是 引 脚 定义 等 )。 例 如 ， 在 一 些 应 用 系统 中 ， 计 算 机 的 
作用 是 从 某 种 测量 设备 (如 天 气 测 量 仪 或 反馈 控制 系统 等 ) 中 采样 数据 ， 那 么 工程 师 要 掌握 
的 知识 就 不 仅 限于 FORTRAN 语 言 了 。 对 于 电子 工程 师 来 说 是 如 此 ， 在 机 械 、 化 工 、 航 空 等 领 
域 亦 如 此 。 而 在 高 级 语言 编程 课程 中 ， 编 译 器 这 个 “保护 层 ” 也 将 计算 机 底层 的 “丑陋 细节 
都 隐藏 了 。 换 句 话说， 如 果 计 算 机 课程 的 内 容 仅 限 于 编程 语言 ， 那 么 培养 出 来 的 学 生 是 无 法 
胜任 未 来 工作 的 。 


涟 游 效 应 


本 书 内 容 对 后 续 课 程 将 产生 涟 满 效应 (rippling effect) 。 例 如 ， 假 设 学 生 对 C 语 言语 法 和 
底层 结构 之 间 的 互动 机 制 已 有 所 了 解 ， 那 么 在 以 后 的 语言 编程 课程 中 就 可 以 将 重点 放 在 问题 
求解 算法 及 更 复杂 的 数据 结构 方面 。 再 如 ， 在 硬件 方面 也 存在 类 似 的 情况 : 在 以 后 的 数字 逻 
辑 设计 和 计算 机 组 织 课程 中 ， 他 们 很 容易 联想 到 硬件 和 上 层 语言 之 间 的 交互 场景 ， 从 而 理解 
底层 设计 的 重点 和 动机 。 在 计算 机 组 织 课程 中 ， 刚 接触 术语 “程序 计数 器 ”(Program Counter) 
时 ， 学 生 通 常会 问 ,“ 为 什么 要 有 程序 计数 器 ， 有 什么 用 ? ”密歇根 大 学 的 教学 反馈 表明 ， 在 
EECS 100 课 程 开设 前 后 ， 学 生 在 后 续 课 程 中 对 该 类 问题 的 理解 有 明显 差异 。 
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第 1 章 “欢迎 阅读 本 书 


1.1 我 们 的 目标 


欢迎 阅读 本 书 。 我 们 的 任务 是 向 你 介绍 “计算 世界 ”(the world of computing) 。 本 书 的 主要 目 
标 之 一 ， 是 希望 你 能 认识 到 计算 世界 并 非 如 此 神秘 。 相 反 ， 计 算 机 (computer) 是 非常 “确定 ”的 
一 个 系统 ， 即 在 任何 时 候 ， 在 相同 的 方法 、 相 同 的 状态 下 (当然 还 包括 相同 的 起 始 条 件 ) ， 同 样 的 
问题 必然 获得 相同 的 结果 。 其 实 ， 计 算 机 并 不 是 什么 电子 天 才 ， 相 反 ， 它 只 是 一 个 电子 傻瓜 ， 只 
会 精确 地 按照 我 们 的 要 求 去 执行 任务 ， 它 本 身 是 没有 心智 的 。 

事实 上 ， 计 算 机 这 样 一 个 复杂 的 机 体 (organism) ， 是 由 一 堆 简单 的 部 件 ， 经 过 精心 的 系统 组 
合 而 成 的 。 本 书 首先 将 介绍 那些 简单 部 件 的 原理 和 机 制 ， 然 后 一 步 一 步 地 搭建 出 一 个 互 连 结构 ， 
即 所 谓 的 “计算 机”"。 这 如 同一 幢 房 子 的 建造 过 程 ， 先 是 从 最 底层 的 “地 基 ” 开 始 ， 自 底 向 上 一 层 
层 地 “添砖加瓦 "， 最 后 形成 一 个 功能 完整 的 计算 机 。 在 逐 层 的 讲述 过 程 中 ， 每 增加 一 层 ， 我 们 都 
将 解释 在 做 什么 ， 以 及 新 出 现 的 概念 与 其 底层 组 织 之 间 的 关系 等 。 我 们 的 目标 是 ， 一 旦 你 完成 了 
这 本 教材 的 学 习 ， 就 能 够 自然 地 操纵 一 种 语言 (如 C 语 言 ) 来 编写 程序 了 ， 并 能 使 用 其 中 的 一 些 高 
级 功能 ， 同 时 也 能 理解 在 程序 执行 过 程 中 ， 计 算 机 底层 所 发 生 的 相应 运作 。 


1.2 怎么 才能 做 到 


从 第 2 章 开始 ， 是 基于 这 样 一 种 理念 ， 即 讨 算 机 不 过 是 个 电子 设备 ， 它 由 许多 电子 部 件 组 成 ， 
而 这 些 部 件 又 通过 导线 相连 。 在 任何 一 个 时 刻 ， 这 些 导 线 要 么 是 高 电 平 、 要 么 是 低 电 平 。 但 是 在 
理解 计算 机 这 种 电子 设备 的 时 候 ， 我 们 并 不 关心 有 具体 的 电压 值 是 多 少 。 换 句 话 说， 电压 是 11$V 还 
是 118V 并 不 重要 ， 我 们 所 关心 的 只 是 “相对 于 0V 电 压 ， 它 是 否 足够 大 ”。 如 果 该 电压 与 90V 电 压 相 
差 很 小 ， 则 在 逻辑 标识 上 将 它 定 义 为 “0”， 而 如 果 电 压 与 9V 相 差 很 大 ， 则 将 它 定义 为 逻辑 “1”。 

同时 ， 通 过 0 和 1 序列 的 组 合 ， 我 们 可 以 表示 任何 信息 。 例 如 ， 可 以 将 字母 a 表示 为 01100001， 
十 进 制 数 35 则 表示 为 00100011。 后 面 将 详细 介绍 这 种 编码 体系 的 原理 。 

当 我 们 开始 习惯 了 通过 0 和 1 编码 来 表示 信息 ， 以 及 基于 这 种 编码 的 操作 (如 “加 ”操作 ) 之 
后 ， 就 会 进入 下 一 个 问题 :“ 计 算 机 是 怎么 工作 的 ? ”在 第 3 章 中 ， 将 介绍 怎样 用 晶体 管 构建 现代 
微 处 理 器 ， 具 体 地 说 ， 就 是 怎样 使 用 晶体 管 来 构建 能 够 运算 的 部 件 (如 “加 法 器 ”) 和 存储 信息 的 
记忆 部 件 (如 “内 存 ”) ， 随后 ， 第 4 章 介绍 “ 冯 . 诺 伊 曼 (Von Neumann) 机 器 ”， 它 是 一 个 描述 
计算 机 应 该 怎样 工作 的 模型 ， 第 5 章 介绍 一 个 简单 的 机 器 ， 即 LC-3 (Little Computer 3)。 从 LC-1 开 
始 ，LC-3 已 经 历 了 两 版 修改 ， 它 具备 现代 微 处 理 器 应 具备 的 所 有 特性 。 所 谓 现代 微 处 理 器 ， 如 
Intel 8088 (用 于 1981 年 的 IBM PC), Motorola 68000 (用 于 经 典 的 1984 年 的 Macintosh)， 以 及 奔腾 
IV ( 它 是 2003 年 高 性 能 PC 的 首选 处 理 器 之 一 ) 等 微 处 理 器 产品 ， 而 LC-3 具 备 这 些 真 实 微 处 理 器 产 
品 所 具备 的 所 有 重要 特性 ， 但 又 不 像 这 些 “ 真 家 伙 ” 那 样 复杂 ， 因 而 很 容易 理解 和 掌 担 。 

在 理解 了 LC-3 的 工作 原理 之 后 ， 下 一 步 就 是 要 对 它 编程 。 开 始 是 采用 其 自身 语言 即 LC-3 机 器 
语言 编程 (第 6 章 ) ， 然后 采用 汇编 语言 编程 (第 7 章 ) ， 当 然 ， 汇 编 语言 相对 人 的 自然 语言 来 说 ， 
多 少 还 是 有 点 儿 让 人 不 习惯 ， 第 8 章 介绍 有 关 LC-3 是 怎样 输入 /输出 信息 的 问题 ， 第 9 章 涉 及 两 个 很 
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重要 的 LC-3 机 制 ， 人 
的 概念 ， 即 “ 栈 ”(stack) 和 “数据 转换 ”(data conversion)。 最 后 ， 将 给 出 一 个 稍微 复杂 的 例子 ， 
是 个 基于 LC 3 编程 实现 的 手持 计算 加， 

本 书 的 第 二 部 分 (第 11~19 章 ) 将 注意 力 转 向 高 级 编程 语言 一 一 C 语 言 。 我 们 将 深入 介绍 C 语 言 
的 很 多 实现 机 制 ， 这 些 内 容 在 一 般 的 入 门 教材 中 是 不 会 介绍 的 。 在 几乎 所 有 的 例 程 中 ， 我 们 都 会 
将 高 层 的 C 结 构 (construct) 和 底层 的 LC-3 实 现 联系 起 来 ， 以 使 你 明白 在 使 用 C 程 序 中 的 特定 结构 
时 ， 它 对 底层 计算 机 存在 什么 要 求 。 

我 们 讲解 C 语 言 的 方法 是 ， 先 介 乡 如 基本 概念 如 变量 和 操作 符 (第 12 章 )、 控 制 结构 (第 13 章 )、 
t (1438) 等 ， 之后， 是 高 级 话题 如 C 语 言 调试 技术 (8152€), 603. (第 16 章 )、 指 针 和 数组 


(第 17 章 ) 等 。 
C 语 言 部 分 的 结束 篇 是 两 个 常见 的 高 层 结 构 ， 即 C 语 言 的 输入 /输出 (第 18 章 ) 和 链表 (第 19 章 )。 


13 两 个 反复 出 现 的 理念 


在 本 韦 中 ， 有 两 个 理念 将 反复 出 现 并 反复 强调 : 一 是 “抽象 "， 二 是 “在 脑子 里 不 要 对 硬件 和 
软件 做 任何 区 分 ”。 这 两 点 非常 重要 ! 我 们 希望 每 个 人 都 能 认识 到 其 中 的 价值 ， 这 也 正 是 我 们 不 断 
向 工程 专业 和 计算 机 科学 专业 的 学 生 所 灌输 的 。 如 果 你 想 成 为 一 个 高 级 工程 师 或 计算 机 科学 家 
领会 这 两 点 远 比 你 理解 计算 机 是 怎样 工作 或 怎样 对 它 编程 更 为 重要 。 随 着 对 全 书 学 习 的 不 断 深入 ， 
相信 你 对 它们 的 理解 会 越 来 越 清 晰 。 

“抽象 ”理念 (notion of abstraction) 非常 重要 ， 它 是 学 习 的 重点 ， 也 是 在 实践 中 要 把 握 的 核 
心理 念 。 不 管 你 未 来 是 要 做 数学 家 、 物 理学 家 、 工 程 专家 ， 还 是 要 做 商业 人 士 ， 抽 象 理 念 都 非常 
有 用 ， 很 难 想像 有 哪个 学 科 或 知识 体系 中 不 需要 “抽象 ”。 同 样 ， 将 硬件 和 软件 做 明显 的 区 分 也 是 
错误 的 ， 这 对 未 来 的 工作 和 学 习 都 会 造成 误导 。 下 面 我 们 就 来 阐述 这 两 个 永恒 的 理念 。 


1.3.1 抽象 之 理念 


抽象 (abstraction) 在 生活 中 普遍 存在 。 当 我 们 搭乘 出 租车 的 时 候 ， 如 果 我 说 “去 飞机 场 ”， 
那么 我 使 用 的 就 是 抽象 的 表达 方式 。 为 什么 昵 ? 因 为 我 还 可 以 用 另 一 种 表述 方式 ， 详 细 告 诉 他 到 
达 目 的 路 线 的 每 一 个 步骤 :“ 顺 这 条 街道 向 前 过 10 个 街区 ， 左 转 "， 然 后 当 他 到 达 这 里 之 后 ， 我 又 
告诉 他 “现在 顺 着 这 条 街道 继续 5 个 街区 ， 右 转 " ， 如 此 继续 。 显 然 ， 你 知道 其 中 的 细节 ， 但 这 远 
不 如 告诉 司机 你 要 去 机 场 来 得 简洁 。 如 果 还 想 进 一 步 细 化 ， 你 甚至 可 以 将 “上 顺 这 条 路 向 前 10 个 街 
区 ……” 这 句 话 分 解 为 “ 踩 油 门 "、“ 转 方向 盘 ”"、“ 注 意 过 往 车 辆 和 人 行道 ”等 这 样 的 动作 细节 ， 
但 显然 没有 这 个 必要 。 

学 会 “抽象 ”是 个 重要 的 进步 ， 它 让 我 们 学 会 站 在 更 高 的 层次 看 问题 ， 从 而 将 事物 的 本 质 表 
现 出 来 ， 而 将 其 中 的 细节 隐藏 起 来 ， 它 让 我 们 学 会 更 有 效 地 使 用 时 间 和 大 脑 ， 它 让 我 们 在 分 析 问 
TAS SOT AA ER. 

当然 ， 其 中 存在 这 样 一 个 假设 ， 即 “假设 各 个 方面 的 细节 都 是 运转 正常 的 "。 但 是 ， 如 果 底 层 
细节 的 工作 并 不 是 完全 正常 呢 ? 这 是 一 个 挑 成 ， 在 这 种 情况 下 ， 要 求 我 们 不 仅 要 具备 抽象 的 能 力 ， 
还 要 具备 “分 解 抽象 ”的 能 力 ， 这 样 才能 保证 问题 的 顺利 解决 。 有 人 又 称 之 为 “解析 ”过 程 ， 即 
从 抽象 回 到 具体 的 过 程 。 

此 肇 ， 让 我 想起 两 个 小 故事 

第 一 个 故事 是 我 很 久 以 前 穿越 亚利桑那 州 的 一 次 旅行 。 那 是 一 个 炎热 的 夏天 ， 我 当时 的 家 是 
在 常年 温和 的 帆 阅 阿尔 托 ( 属 加 利 福 尼 亚 州 )。 为 了 应 对 亚利桑那 州 的 炎热 天 气 ， 我 在 出 发 之 前 去 
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机 械 师 那里 改装 车 子 的 制冷 系统 。 注 意 ， 我 在 这 里 用 了 一 个 很 抽象 的 说 法 一 “制冷 系统 ”。 然 而 ， 
我 忽略 了 一 个 细节 ， 应 对 帕 洛 阿尔 托 的 天 气 所 需要 的 制冷 系统 远 不 足以 对 付 亚利桑那 州 沙 漠 的 炎 
热 。 结 果 你 一 定 猜 到 了 ， 制 冷 系统 在 到 达 目 的 地 之 前 出 问题 了， 结果 我 被 迫 在 Deer Lodge OEHR 
那州 人 日 第 三 大 的 城市 ) 待 了 两 天 ， 等 待 维修 所 需要 的 盖 板 密 封 圈 到 货 。 

第 二 个 故事 〈 可 能 是 杜撰 的 传闻 ) 发 生 在 电力 发 电 时 代 的 早期 。 通 用 电气 公司 的 一 个 大 发 电 
机 出 故障 了 ， 但 面 对 发 电机 前 板 上 一 大 堆 的 仪表 盘 和 旋钮 ， 所 有 的 人 都 束手无策 。 大 家 都 知道 ， 
调整 其 中 的 某 些 旋钮 就 可 能 解决 问题 ， 但 谁 也 无 法 确定 是 其 中 的 哪些 旋钮 ， 以 及 应 该 是 顺 时 针 还 
是 逆 时 针 旋 转 、 转 多 少 角 度 ? 正在 这 时 ， 请 来 了 电力 厂 创建 初期 的 一 个 大 师 级 人 物 。 他 看 了 一 眼 
仪表 盘 ， 又 仔细 地 听 了 一 会 儿 电 机 的 声音 。 然 后 ， 他 从 口袋 里 拿 出 一 个 螺丝 刀 ， 将 其 中 的 一 个 旋 
钮 逆 时 针 旋 转 了 35"， 机 器 正常 了 ! 随后 ， 他 为 自己 这 两 分 钟 的 工作 开 出 了 一 张 1000 美 元 的 收费 单 
(这 在 当时 是 一 笔 丐 款 )。 控 制 中 心 接 到 这 份 账单 时 很 不 情愿 ， 于 是 请 求 他 开 一 个 具体 的 明细 账单 ， 
以 说 明 收 费 理由 ， 新 账单 的 明细 如 下 : 

(1) 将 旋钮 逆 时 针 旋 转 35”: $0.75 

(2) 知道 旋转 哪个 旋钮 以 及 旋转 多 少 度 : $999.25 

两 个 故事 所 表达 的 信息 是 相同 的 ， 即 “抽象 ”能 提高 我 们 的 效率 ， 从 而 摆脱 细节 的 纠缠 。 如 
果 事 情 不 存 在 什么 意外 ， 就 会 一 切 OK1 即 如 果 我 不 是 去 亚利桑那 州 旅游 的 话 ， 抽 象 词 “ 制 冷 系 统 ” 
就 是 够 了 ， 而 当时 我 却 忽 略 了 告诉 机 械 师 要 穿越 亚利桑那 州 沙 漠 这 个 “细节 ”。 同 样 ， 如 果 不 是 电 
机 发 生 了 意外 故障 ， 大 师 对 电机 的 深刻 理解 也 就 派 不 上 用 场 了 。 

从 这 两 个 故事 中 ， 我 们 获得 的 启示 是 ; 当 设 计 一 个 由 各 种 门 电路 组 成 的 逻辑 电路 时 ， 千 万 不 
要 深 陷 门 电路 的 内 部 原理 ， 因 为 这 会 大 大 拖延 设计 进度 。 你 应 该 将 其 中 的 每 个 门 电路 都 看 做 是 现 
成 的 、 可 靠 的 ， 而 仅 当 电路 不 工作 的 时 候 ， 才 去 研究 门 电路 的 内 部 结构 ， 也 只 有 这 样 ， 才 能 发 现 
问题 的 症结 所 在 。 

再 如 ， 当 你 设计 一 个 复杂 的 计算 机 应 用 程序 ， 如 电子 表格 处 理 系 统 、 字 处 理 系 统 或 计算 机 游 
戏 时 ， 你 可 以 将 其 使 用 到 的 每 个 组 件 都 看 做 是 一 个 “抽象 "。 此 时 ， 探 究 每 个 组 件 的 细节 是 毫 无 意 
义 的 ， 那 只 会 让 你 的 工作 永远 无 法 结束 。 但 当 系 统 出 现 问题 时 ， 要 想 发 现 问题 所 在 ,就 必须 深入 
到 每 个 组 件 的 实现 机 制 。 

抽象 技能 相当 重要 。 我 们 的 观点 是 ， 抽 象 的 层次 越 高 越 好 ， 而 且 它 与 工作 效率 成 正比 。 本 书 
的 做 法 是 逐步 提高 抽象 层次 ， 我 们 先是 基于 晶体 管 描述 逻辑 门 的 实现 机 制 ， 但 一 旦 你 领会 了 逻辑 
门 的 抽象 ， 唱 体 管 将 永 不 再 提 ， 随后， 就 是 基于 逻辑 门 来 构建 更 高 层次 的 结构 ， 而 一 旦 我 们 理解 
了 这 些 结构 ， 逻 辑 门 又 将 被 丢弃 。 | 

结论 

“抽象 ”能 提高 我 们 的 思考 效率 。 换 旬 话 说 ， 忽 略 抽 象 之 下 的 细节 ， 会 让 我 们 更 有 效率 。 希 望 
不 要 有 人 一 昕 到 “抽象 ”就 反感 哦 1 相反 ， 你 应 该 感谢 它 ， 抽 象 确实 能 提高 我 们 的 效率 。 

如 果 我 们 不 需要 将 一 个 组 件 (component) 和 其 他 的 东西 相 结合 〈 以 构建 更 大 的 系统 ) ， 并 且 
组 件 内 部 也 不 会 出 问题 ， 那 么 ， 将 认识 停留 在 抽象 层面 就 万 事 大 吉 了 。 但 实际 情况 是 ， 我 们 肯定 
会 需要 将 这 些 组 件 拼装 成 更 大 的 式 统 ， 而 这 些 组 件 结合 在 一 起 工作 的 时 候 ， 也 难免 会 出 错误 。 这 
就 意味 着 ， 我 们 既 要 不 断 地 提高 抽象 层次 ， 又 要 注意 细节 的 深 人 。 


1.8.2 硬件 与 软件 


许多 计算 机 科学 家 或 工程 师 称 他 们 自己 是 搞 硬件 的 或 是 搞 软件 的 。 硬 件 通 常 指 一 个 “物理 的 ” 
计算 机 以 及 和 它 相 关 的 方方面面 ， 而 软件 通常 指 程序 ， 如 操作 系统 UNIX 或 Windows、 数 据 库 系统 
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Oracle 或 DB-terrific、 应 用 程序 Excel 或 Word 等 。 他 们 的 这 种 说 法 是 暗示 他 们 对 其 中 的 某 一 方面 相 
当 精 通 ， 而 对 另 一 方面 知之 其 少 。 昕 起 来 好 像 在 软件 和 硬件 之 间 存 在 一 堵 很 高 的 墙 ， 硬件 是 描述 
有 关 计 算 机 怎样 工作 的 ， 而 软件 的 主导 则 是 程序 ， 你 要 做 的 就 是 选择 待 在 墙 的 哪 一 边 。 

当 你 开始 学 习 和 接触 计算 机 的 时 候 ， 我 们 希望 你 抛弃 这 种 观点 。 因 为 在 我 们 看 来 ， 硬 件 和 软 
件 只 是 计算 机 系统 中 两 个 组 成 部 分 的 名 称 而 已 ， 对 设计 者 来 说 ， 其 体 将 计算 机 的 某 个 功能 划分 给 
哪 部 分 来 实现 ， 以 及 它们 之 间 如 何 协同 工作 ， 原 则 只 有 一 个 : 让 计算 机 工作 得 最 棒 (而 不 是 刻意 
要 区 分 它们 ) ! 

处 理 器 的 设计 者 如 果 懂 得 运行 在 处 理 器 之 上 的 程序 需求 ， 那 么 所 设计 的 处 理 器 必然 比 那些 不 
懂 的 人 所 设计 的 处 理 器 要 快 。 例 如 ，Iintel、Motorola 等 大 牌 处 理 器 设计 厂家 ,在 许多 年 前 就 意识 到 ， 
未 来 的 程序 如 E-mail、 视 频 游 戏 、 视 频 电影 等 ， 将 大 量 包含 视 频 信 息 (video clip)， 未 来 的 处 理 器 
必须 保证 它们 的 执行 性 能 。 结 果 是 ， 在 他 们 所 设计 的 处 理 器 中 ， 大 都 内 典 了 专用 视频 处 理 硬 件 。 
如 Intel 为 此 提出 的 MMX 指令 集 及 MMX 专用 执行 硬件 ， 而 Motorola 和 Apple 也 做 了 类 似 工 作 ， 如 
AltaVec 指 令 集 及 其 硬件 。 

软件 设计 中 也 有 类 似 的 故事 。 懂 硬件 特性 的 软件 设计 师 所 设计 的 程序 ， 其 运行 性 能 远 高 于 那 
些 不 懂 硬 件 的 人 所 设计 的 程序 。“ 排 序 ” 是 一 个 经 典 的 计算 任务 ， 几 平 在 所 有 的 大 型 软件 中 都 不 可 
或 缺 。 我 们 需要 将 一 系列 的 条 目 (item) 按照 一 定 的 顺序 排列 ， 如 宇 典 中 的 单词 需要 按 字母 排序 ， 
学 生成 绩 单 是 按 数 字 排 序 的 。 存 在 太 多 有 关 排 序 的 编程 方法 (又 称 算法 )。 但 是 ，Donald Knuth 在 
他 的 传世 巨著 《计算 机 程序 设计 艺术 》( 第 3 卷 ) 中 ， 竞 然 花 了 391 页 的 篇 幅 专 门 讲述 排序 ， 因 为 要 
想 做 到 排序 最 快 ， 在 很 大 程度 上 取决 于 软件 设计 者 对 硬件 特性 的 了 解 。 

结论 

我 们 相信 ， 不 管 你 未 来 的 职业 取向 是 计算 机 软件 还 是 硬件 ， 两 者 都 懂 必 然 会 使 你 更 强 。 本 书 
的 宗旨 就 是 让 你 两 者 都 掌握 。 有 时 我 们 在 讲述 一 个 概念 的 时 候 ， 并 未 特意 强调 是 关于 软件 或 是 关 
于 硬件 的 ， 但 通常 是 两 者 都 相关 的 。 

当 你 在 学 习 数据 类 型 (data type) 这 个 软件 概念 时 (第 12 章 )， 你 将 理解 硬件 中 字 (word) 的 
有 限 长 度 ， 是 怎样 影响 软件 中 数据 类 型 表示 的 。 

当 你 学 习 函 数 (function) 时 (第 14 章 )， 你 会 联想 起 硬件 的 知识 ， 从 而 明白 “函数 调用 规则 ” 
的 含义 和 意义 。 

当 你 学 习 递归 (recursion) 一 一 一 个 强大 的 算法 工具 时 (第 16 章 )， 结 合 硬 件 知识 ， 你 将 明白 
为 什么 花 些 时 间 递 归 执 行 过 程 (procedure) 是 值得 的 。 

当 你 学 习 指 针 (pointer) 变量 时 (第 17 章 )， 有 关 计 算 机 内 存 的 知识 将 更 有 助 于 深入 理解 指针 ， 
从 而 知道 什么 时 候 适 合 使 用 它 ， 什 么 时 候 不 适合 使 用 它 。 

当 你 学 习 数据 结构 (data structure) 时 (第 19 章 )， 有 关 计 算 机 内 存 的 知识 ， 将 帮助 你 理解 数 
据 结构 在 内 存 中 的 具体 实现 ， 以 及 有 效 操 作 数据 结构 的 窍门 。 

我 们 知道 ， 前 面 的 内 容 中 所 出 现 的 很 多 名 词 让 你 感到 迷惑 ， 不 要 紧 ， 在 本 章 结 束 的 时 候 再 重 
读 一 遍 以 上 内 容 即 可 。 目 前 你 仅仅 需要 认识 到 : 软件 中 的 许多 重要 话题 是 和 硬件 中 的 话题 紧密 交 
织 的 。 我 们 的 观点 是 : 无 论 你 更 倾向 于 其 中 的 哪 一 面 ， 从 两 方面 思考 必然 会 使 其 更 容易 。 

更 重要 的 是 ， 面 对 大 多 数 的 计算 问题 ， 如 果 解 题 者 具备 软 、 硬 件 两 方面 的 知识 ， 那 么 他 或 她 
给 出 的 答案 会 更 漂亮 。 


1.4 计算 机 系统 简 述 


在 前 面 的 章节 中 ， 我 们 已 多 次 使 用 了 “计算 机 ”这 个 词 ,但 并 未 直接 解释 过 其 定义 。 它 是 指 
这 样 一 种 机 制 ， 即 同时 在 做 着 两 方面 的 事情 ; 既 控 制 着 信息 的 处 理 过 程 ， 同 时 也 是 信息 处 理 过 程 
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的 具体 执行 者 。 所 谓 “ 控 制 着 信息 的 处 理 过 程 ”(directs the processing of information) ， 指 的 是 它 
必须 决策 下 一 个 执行 任务 是 什么 ， 而 “处 理 过 程 的 具体 执行 者 "， 意 味 着 它 必须 具备 “加 ”、“ 乘 ” 
等 运算 能 力 以 产生 执行 结果 。 该 机 制 更 准确 、 更 合适 的 称谓 应 该 是 “中 央 处 理 器 ”(Central 
Processing Unit, CPU)。 本 书 的 重点 也 是 围绕 CPU 及 其 之 上 的 程序 运行 而 展开 的 。 

在 20 年 前 ， 一 个 处 理 器 由 10 个 或 更 多 的 18 英 寸 电 路 板 组 成 ， 每 个 电路 板 上 包含 了 大 约 50 个 部 
件 (采用 集成 电路 封装 ， 如 图 1-1 所 示 )。 而 今天 的 处 理 器 通常 由 一 个 微 处 理 器 芯片 组 成 ， 其 大 小 仅 
为 一 片 1 英 寸 左右 的 硅 材 料 ， 其 中 包含 了 大 约 几 百 万 个 晶体 管 ( 如 图 1-2 所 示 )。 
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图 1-1 处 理 器 板 ，1980 年 产 图 1-2 微 处 理 器 ，1998 年 产 


资料 提供 : Emilio Salgueiro, Unisys Corp. 资料 提供 : Intel Corp. 


然而 大 多 数 人 更 熟悉 “计算 机 ”这 个 词 ， 它 包含 了 比 处 理 器 更 多 的 意思 。 一 个 计算 机 系统 
(computer system) 由 更 多 的 部 件 组 成 (如 图 1-3 所 示 )， 除 了 处 理 器 之 外 ， 还 包括 键盘 (用 来 输入 
命令 )、 鼠 标 〈 用 来 点 击 菜单 )、 显 示 器 (用 来 显示 计算 机 系统 产生 的 信息 )、 打 印 机 (用 来 打印 信 
息 的 拷贝 )、 内 存 (用 来 临时 存储 信息 )、 磁 盘 和 CD-ROM (用 来 永久 存储 信息 及 很 多 可 以 执行 的 程 
序 或 软件 )。 

这 些 附 加 的 部 件 更 方便 了 计算 机 最 终 用 户 的 使 用 。 例 如 ， 如 果 没 有 打印 机 ， 就 只 能 手 抄 屏幕 
上 显示 出 来 的 信息 ， 而 没有 鼠标 ， 你 将 永远 手工 输入 各 种 命令 ， 不 像 现 在 这 样 ， 轻 轻 点 击 鼠 标 按 


键 ， 就 可 以 启动 命令 。 

















图 1-3 个 人 计算 机 (Personal Computer, PC) 
资料 提供 : Dell Corp. 
因而 ， 在 我 们 开始 本 书 的 旅途 之 际 ， 需 要 声明 的 是 ， 本 书 的 重点 落 在 那 1 英 寸 的 空间 内 部 ， 即 
CPU。 但 若 设 有 其 他 这 些 部 件 〈 虽 然 它 们 不 是 本 书 的 重点 内 容 ) ， 计 算 机 使 用 起 来 就 不 会 那么 方便 了 。 


1.5 两 个 非常 重要 的 思想 


在 结束 第 1 章 之 前 ， 我 们 还 将 介绍 两 个 非常 重要 的 思想 。 它 们 非常 重要 ， 论 述 了 计算 
(computing) 的 全 部 内 涵 ， 因 而 我 们 希望 你 能 了 解 它们 。 

第 一 : 所 有 的 计算 机 (不管 是 最 大 的 还 是 最 小 的 、 最 快 的 还 是 最 慢 的 、 最 贵 的 还 是 最 廉价 的 )， 
只 要 给 予 足 够 的 时 间 和 内 存 ， 它 们 所 能 完成 的 计算 任务 是 相同 的 。 换 句 话 说 ， 最 快 的 计算 机 能 够 
完成 的 事情 ， 最 慢 的 计算 机 也 一 样 能 够 完成 ， 只 是 更 慢 一 些 而 已 ， 而 一 个 便宜 的 计算 机 所 不 能 完 
成 的 事情 (如 果 有 足够 内 存 的 话 )， 对 于 一 个 更 昂贵 的 计算 机 来 说 ， 同 样 也 是 无 法 完成 的 。 总 之 ， 
所 有 的 计算 机 能 够 完成 完全 相同 的 事情 。 只 是 有 些 计算 机 可 能 做 得 更 快 些 ， 但 绝 不 会 做 得 更 多 。 

第 二 : 我 们 用 英语 或 其 他 语言 给 出 了 一 个 问题 ， 然 而 计算 机 却 能 通过 电子 运转 (运行 程序 ) 
来 解决 这 个 问题 ， 太 奇妙 了 ! 至 于 怎样 把 用 人 类 语言 描述 的 问题 转换 成 能 够 影响 电子 运转 的 电压 ， 
需要 一 系列 的 、 系 统 的 转换 过 程 。 在 计算 机 的 50 年 历史 里 ， 这 一 转换 问题 竟然 被 成 功 解决 了 ， 而 
且 这 一 复杂 的 转换 任务 竟然 是 由 计算 机 本 身 完成 的 。 看 起 来 不 可 思议 ， 但 确实 如 此 。 

本 章 后 面 的 内 容 将 详细 阐述 这 两 个 思想 。 


1.6 计算 机 : 通用 计算 设备 


一 本 入 门 性 的 教科 书 先 描述 计算 机 是 怎么 工作 的 ， 感 觉 有 些 奇怪 吧 ? 机 械 专业 的 学 生 是 先 学 
物理 ， 然 后 才 是 汽车 发 动机 的 工作 原理 ， 化 学 工程 专业 的 学 生 是 先 学 化 学 ， 而 不 是 石油 提炼 。 那 
为 什么 计算 机 专业 的 学 生 要 先 学 计算 机 设备 呢 ? 

FRE: 计算 机 是 特别 的 。 要 学 习 计算 机 的 基本 原理 ， 必 须 先 了 解 计 算 机 是 怎样 工作 的 。 其 
原因 在 于 计算 机 被 称 为 “通用 计算 设备 ”(universal computational device), RER? 请 看 下 面 
的 解释 。 

在 现代 计算 机 出 现 之 前 ， 兽 经 出 现 了 很 多 能 够 计算 的 机 器 。 其 中 ， 有 些 是 模拟 机 (analog machine) 
一 一 即 机 器 产生 的 结果 是 用 可 测量 的 模拟 量 来 表示 的 〈 如 电压 、 上 距离 等 )。 例 如 ， 清 动 计算 尺 计算 乘 法 
的 机 制 ， 就 是 请 动 其 中 的 一 个 对 数 等 分 尺 ， 然 后 从 第 二 个 尺子 上 读 出 其 对 数 “ 上 距离 ”。 还 有 些 早 期 的 
加 法 器 ， 其 工作 原理 是 采用 在 秤 盘 上 加 重量 的 方式 。 模 拟 机 器 的 缺陷 主要 是 难以 提高 其 精度 。 

同 模拟 机 相 比 ， 数 字 机 (digital machine) 通过 一 组 固定 的 、 有 限 的 数字 和 字符 来 完成 操作 ， 
这 就 是 为 什么 数字 机 最 终 主 宰 计算 世界 的 原因 。 你 应 该 很 熟悉 模拟 手表 和 数字 手表 之 间 的 区 别 9。 
模拟 手表 有 时 针 、 分 针 ， 以 及 秒针 ， 它 通过 这 些 针 的 位 置 来 表达 具体 的 时 间 ， 而 数字 手表 通过 数 
字 来 表达 时 间 。 对 于 数字 手表 , 提高 其 精度 的 办 法 是 增加 数字 数目 , 如 10 : 35 : 16 (而 不 是 10 : 35), 
但 对 于 机 械 手 表 ， 该 怎样 表达 百 分 之 一 秒 这 样 的 精度 呢 ? 可 以 的 ， 但 你 或 许 需要 再 加 一 个 更 长 的 
秒针 (应 该 比 已 有 的 秒针 更 长 些 ) 。 本 书 在 提 到 计算 机 的 时 候 ， 讲 述 的 对 象 是 数字 计算 机 。 

在 现代 数字 计算 机 出 现 之 前 ， 在 西方 最 常见 的 数字 机 是 加 法 器 (adding machine), MERKA 
用 的 则 是 神奇 的 算盘 。 加 法 器 是 一 种 能 执行 特定 “加 ”功能 的 机 械 或 机 电 设 备 。 另 外 ， 还 有 各 种 
各 样 的 其 他 数字 机 ， 有 的 能 够 执行 整数 乘法 ， 有 的 能 对 一 堆 有 打 筷 标识 的 卡片 做 字母 排序 。 所 有 
这 些 机 器 的 局 限 性 在 于 ， 它们 都 只 能 做 一 件 特定 的 工作 。 例 如 ， 如 果 你 有 一 台 只 能 做 加 法 的 机 器 ， 
那么 做 两 个 数 的 乘法 运算 时 ， 还 得 用 纸 和 铅笔 。 

但 计算 机 就 不 一 样 了 。 你 需要 告诉 计算 机 的 是 “方法 ”和 “任务 ”"”， 即 怎样 做 加 法 ， 怎 样 做 乘 
法 ， 怎 样 对 一 堆 表单 做 排序 或 任何 其 他 计算 任务 。 而 假若 你 又 想 出 了 新 的 计算 方 靶 ， 就 不 需要 再 

日” 生活 中 我 们 俗称 它们 为 机 械 表 和 电子 表 ， 但 这 种 说 法 已 不 太 准 确 ， 如 石英 表 就 是 机 械 和 电子 混合 的 ， 但 石 

英 表 局 于 模拟 表 。 一 一 译 者 注 
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购买 或 设计 新 机 器 了 ， 所 要 做 的 惟一 事情 ， 就 是 在 原来 的 计算 机 上 增加 一 些 新 的 指令 (instruction) 
或 程序 (program) 即 可 。 这 就 是 我 们 称 计算 机 为 “通用 计算 设备 ”的 原因 。 计 算 机 科学 家 相信 
“任何 事情 都 是 可 计算 的 "， 换 旬 话 说， 也 就 意味 着 任何 事情 都 是 可 被 计算 机 所 运算 的 (只 要 给 它 
足够 的 时 间 和 内 存 )。 当 我 们 学 习 计算 机 的 时 候 ， 我 们 要 学 习 计算 的 基本 原理 ， 即 计算 是 什么 ? 怎 
样 实施 计算 ? 

通用 计算 思想 的 产生 要 归功 于 Alan Turing (阿兰 : 图 灵 )。1937 年 ， 图 灵 提 出 一 个 大 胆 的 假设 ， 
任何 计算 都 可 以 由 这 样 一 台 机 器 来 完成 。 这 个 机 器 就 是 图 灵机 (Turing machine) 。 他 为 这 类 机 器 给 出 
了 一 个 清晰 的 数学 描述 ， 但 没有 为 之 建造 一 台 真 正 的 机 器 。 世 界 上 真正 可 运行 的 数字 计算 机 是 在 1946 
年 才 出 现 的 。 图 灵 的 兴趣 在 于 解决 一 个 哲学 问题 ， 计算 的 可 定义 性 。 于 是 ， 他 开始 观察 人 们 在 计算 时 
所 采用 的 各 种 方法 和 行为 ， 其 中 包括 : 在 纸 上 做 标记 (mark)， 按 照 一 定 的 规则 记录 符号 (symbol) 
等 行为 。 并 将 这 些 行为 抽象 出 来 ， 定 义 了 一 种 能 够 表达 它们 的 机 制 ， 同 时， 他 还 给 出 了 一 些 例子 ， 来 
解释 基于 这 种 机 制 是 怎样 完成 一 些 特定 任务 的 ， 例 如 ， 用 图 灵机 来 完成 两 个 整数 的 加 法 及 乘法 。 





图 1-4 图 灵机 的 黑箱 模型 


和 1-4 分 别 是 图 灵机 加 法 和 乘法 的 “黑箱 ”模型 ， 要 完成 的 任务 描述 如 箱 体 内 文字 所 示 ， 被 操 
作 数 据 从 箱 体 输入 ， 操 作 结 果 从 箱 体 输 出 。 黑 箱 模 型 并 不 具体 说 明 任务 是 怎样 完成 的 ， 但 实际 上 
有 很 多 种 方法 都 可 以 实现 两 个 数 的 加 法 或 乘法 。 

图 灵 提 出 ， 任 何 计 算 都 可 以 通过 某 种 图 灵机 来 完成 ,我 们 称 这 个 理论 为 “图 灵 论 题 ” 
(Turing's thesis)。 虽 然 图 灵 论题 从 来 设 有 被 严格 证 明 ， 但 众多 的 证 据 都 表明 它 是 正确 的 。 同 时 我 
们 发 现 ， 任 何 试图 对 图 灵机 做 出 的 改进 尝试 ， 最 终 都 可 以 用 图 灵机 本 身 来 实现 。 

有 关 图 灵机 理论 的 最 好 阐述 ， 还 要 数 图 灵 本 人 的 那 份 论文 。 他 这 样 说 道 : 要 构建 一 个 比 任何 
形式 的 图 灵机 都 要 强大 的 机 器 ， 则 这 个 机 器 UV 必 须 能 仿真 所 有 的 图 灵机 。 假 设 ， 我 们 希望 机 器 U0 能 
仿真 图 灵机 中 两 个 整数 相 加 的 模型 ， 则 给 定 输入 ，U 应 该 能 输出 对 应 的 求 和 结果 。 随 后 图 灵 证 明 ， 
图 灵机 也 可 以 做 到 这 点 。 由 此 证 明了 ， 任 何 试图 发 现 图 灵机 所 不 能 做 的 事情 的 企图 都 是 失败 的 。 

图 1-5 进 一 步 阐明 了 这 一 点 。 假 设 要 计算 “8g x (etf )”， 很 简单 ， 你 只 需要 向 0 提供 “加 法 ”图 
灵机 和 “乘法 ”图 灵机 的 描述 ， 以 及 三 个 输入 参数 e、f 和 8 ， 剩 下 的 事情 交 给 U 来 做 即 可 。 
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gx(e+) 


efg 通用 图 灵机 


图 1-5 通用 图 灵机 的 黑箱 模型 
在 通用 图 灵机 UV 的 描述 中 ， 图 灵 第 1 次 深入 地 阐述 了 一 个 论题 ， 即 计算 机 能 做 什么 。 换 名 话说 ， 
一 台 计 算 机 (拥有 是 够 的 内 存 ) 和 一 个 通用 图 灵机 之 间 ， 它 们 所 能 完成 的 事情 是 一 样 的。 它们 中 
的 任意 一 个 ， 只 要 给 定 计算 任务 的 描述 及 相关 数据 ， 都 能 计算 出 结果 。 计 算 机 或 图 灵机 能 够 计算 
任何 可 计算 的 任务 ， 因 为 它们 都 是 可 编程 的 。 
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因此 我 们 说 ， 即 使 是 一 台 昂 贵 的 大 型 计算 机 ， 它 所 能 完成 的 事情 并 不 比 一 台 廉 价 的 小 计算 机 
多 多 少 。 多 花 的 钱 只 是 使 你 拥有 的 计算 机 速度 更 快 、 显 示 器 的 分 辩 率 更 高 、 声 卡 系统 音质 更 好 。 
如 果 你 的 计算 机 是 一 台 廉 价 的 个 人 计算 机 ， 你 就 已 经 拥有 了 一 台 通用 (Universal) 计算 机 。 


1.7 从 问题 描述 到 电子 运转 
图 1-6 描 述 的 是 要 控制 电子 (器件) 按 我 们 的 意图 工作 所 经 历 的 整个 过 程 。 我 们 称 这 个 过 程 的 
每 个 步骤 为 “转换 层次 "， 其 中 的 每 一 明 都 有 多 种 实现 选择 ， 如 果 我 们 忽视 其 中 的 任 一 层 ， 设 计 完 
美 计算 机 系统 的 愿望 都 会 失败 。 
问题 
算法 
语言 


机 器 (ISA) 结构 


器 件 
图 1-6 转换 层次 


1.7.1 问题 的 提出 

描述 问题 的 时 候 ， 我 们 采用 “自然 语言 ”， 即 人 们 所 说 的 语言 ， 如 英语 、 法 语 、 日 语 、 意 大 利 
语 等 。 这 些 语言 都 经 历 了 几 百 年 的 发 展 ， 其 中 包含 了 太 多 的 不 适合 作为 计算 机 语言 的 东西 ， 其 中 
二 义 性 特征 最 为 突出 。 自 然 语 言 中 包含 了 太 多 的 二 义 性 ， 如 不 同 的 说 话 声调 和 音量 ， 以 及 不 同 的 
上 下 文句 子 内 容 ， 都 会 使 得 同一 段 话 表现 出 不 同 的 语义 。 

英语 中 有 个 经 典 例 句 :“Time flies like an arrow”( 光 阴 飞 似 箭 )。 我 们 至 少 可 以 有 三 种 解释 方 
法 ， 取 决 于 下 面 三 种 场景 : 

(1) 一 个 人 正在 注意 时 间 的 流逝 有 多 快 。 

(2) 一 个 人 正在 做 昆虫 赛跑 比赛 的 相关 工作 。 

(3) 一 个 人 正在 给 昆虫 爱好 者 Abby 写 信 。 

其 中 ， 第 一 种 情况 是 一 个 明 喻 ， 表 示 时 间 的 流逝 如 箭 一 般 ， 第 二 种 情况 是 这 个 人 告诉 时 间 记 
录 员 他 /她 应 该 像 箭 一 样 快 速 工作 ， 第 三 种 情况 是 指 一 种 特殊 的 flies(time flies) like arrow, 而 另 一 种 
flies(fruit flies) like bananae 。 

类 似 的 二 义 性 对 于 计算 机 指令 来 说 是 不 能 接受 的 。 计 算 机 是 一 个 电子 傻瓜 ， 它 只 能 做 你 让 它 
做 的 事情 ， 但 如 果 你 给 它 的 命令 存在 有 多 种 意思 ( 即 二 义 性 ) ， 它 就 会 范 然 不 知 所 措 了 。 


1.7.2 算法 
从 问题 的 提出 开始 ， 向 下 转换 的 第 一 步 是 将 问题 的 自然 语言 描述 转 杭 为 算 靶 (algorithm) fi 


日 、 源 自 语言 学 上 的 一 个 例子 : “Flies like an arrow, fruit flies likes a banana." (光阴 飞 似 箭 ， 果 蝇 喜 欢 香 芍 ) ， 
外 形 完 全 一 样 的 句子 ， 结 构 完全 不 同 ， 这 里 是 个 笑话 。 一 一 译 者 注 C 
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述 ， 去 除 那些 无 用 的 特性 。 算 法 描述 的 特点 是 流程 化 、 步 又 清晰 ， 并 确保 该 流程 能 终止 。 其 中 每 
个 步骤 的 定义 描述 都 足够 精确 ， 以 保证 能 在 计算 机 上 执行 。 这 些 特性 可 以 阐述 如 下 : 

。 确 定性 (definiteness) 。 表 明 每 个 操作 步 又 的 描述 是 清晰 的 、 可 定义 的 。 我 们 认为 “制作 烙 

饼 的 过 程 说 明 ” 是 缺乏 定义 性 的 ， 因 为 它 说 “拼命 搅动 直到 成 为 糊 状 ”(stir until lumpy), 

其 中 “ 糊 状 ”(lumpy) 的 程度 表述 就 是 模糊 的 。 

。 可 计算 性 (effective computability) 。 表 示 每 一 步 的 描述 都 可 被 计算 机 执行 。 而 “ 取 最 大 的 

素数 ”这 样 一 句 描述 ， 我 们 称 其 不 具备 可 计算 性 的 ， 因 为 根本 就 不 存在 “最 大 ”的 素数 。 

。 有限 性 (finiteness)。 即 过 程 是 会 终止 的 。 

任何 一 个 问题 都 具有 多 种 求解 算法 。 其 中 ， 有 的 算法 步骤 最 少 ， 有 的 算法 允许 个 别 步 骤 反 复 
执行 ， 等 等 。 值 得 注意 的 是 ， 如 果 一 个 算法 虽然 描述 出 来 的 步骤 很 多 ， 但 如 果 这 些 步 骤 在 一 个 时 
刻 可 以 同时 被 计算 机 执行 〈 并 行 )， 无 疑 该 算法 的 执行 速度 是 快 的 。 


1.7.3 程序 


下 一 步 就 是 将 算法 转换 为 程序 ， 即 用 编程 语言 描述 。 编 程 语言 属于 “机 械 语言 ”， 与 自然 语言 
不 同 的 是 ， 机 械 语言 不 是 设计 出 来 为 人 所 讲 的 ， 相 反 ， 它 被 设计 成 严格 的 顺序 方式 ， 以 便 让 计算 
机 顺序 地 执行 指令 序列 。 换 名 话说 ， 它 不 存在 二 义 性 问题 。 

大 约 有 1000 多 种 程序 语言 。 有 的 是 有 “特定 用 途 ” 的 《如 Fortran 是 科学 计算 语言 、COBOL 是 
商业 数据 处 理 语言 )， 而 本 书后 半 部 分 介绍 的 C 语 言 是 专门 为 底层 硬件 操作 而 设计 的 语言 。 

还 有 用 于 其 他 一 些 目的 的 语言 ， 如 Prolog 语 言 常用 来 设计 专家 系统 ，LISP 语 言 则 被 那些 研究 人 
工 智能 的 人 们 所 青睐 ， 而 Pascal 语 言 则 成 了 学 生 学 习 计算 机 语言 的 教学 语言 。 

计算 机 语言 可 以 分 为 高 级 语言 和 低级 语言 两 类 。 高 级 语言 和 底层 计算 机 的 相关 性 很 弱 (距离 很 
远 ) ， 或 称 之 为 “机 器 无 关 ” 语 言 。 前 面 提 到 的 各 种 语言 都 属于 高 级 语言 。 低 级 语言 则 和 执行 程序 
的 计算 机 紧密 相关 ， 通 常 一 种 低级 语言 只 对 应 一 种 计算 机 ， 我 们 称 之 为 “ 某 某 机 器 的 汇编 语言 ”。 


1.74 指令 集结 构 


下 一 步 的 任务 是 将 程序 转换 成 特定 计算 机 的 指令 集 (instruction set) 。 指 令 集结 构 
(Instruction Set Architecture, ISA) 是 程序 和 计算 机 硬件 之 间接 口 的 一 个 完整 定义 。 

ISA 定 义 包括 : 计算 机 可 以 执行 的 指令 集合 ， 即 计算 机 所 能 执行 的 操作 ， 以 及 每 个 操作 所 需 数 
据 是 什么 ， 即 操作 数 (operand) ，ISA 还 定义 了 可 接受 的 (legitimate) 操作 数 表达 方式 ， 即 数据 
类 型 (data type) ， ISA 还 定义 了 获取 操作 数 的 机 制 ， 即 定位 各 种 操作 数 的 不 同方 法 ， 我 们 称 之 为 
“ 寻 址 模式 ”(addressing mode), 

不 同 的 ISA 定 义 的 操作 类 型 、 数 据 类 型 和 寻 址 模式 的 数目 都 是 不 同 的 。 有 的 ISA 只 有 几 个 操作 
类 型 ， 有 的 ISA 则 有 上 百 个 ， 有 的 ISA 只 有 一 种 数据 类 型 ， 有 的 则 有 几 十 种 ， 有 的 ISA 只 有 一 、 两 
种 寻 址 模式 ， 而 有 的 则 有 20 多 种 。 如 x86 (PC 机 中 的 ISA) ， 有 100 种 操作 类 型 、 十 几 种 数据 类 型 、 


二 十 多 种 寻 址 模式 。 1 

ISA 的 设计 中 ， 还 要 折 囊 考虑 计算 机 内 存 的 大 小 及 每 个 存储 单元 的 宽度 〈 即 能 容纳 的 0 和 1 的 
KA). - 

许多 ISA 一 直 延 续 至 今 ， 典 型 的 例子 就 是 x86。 该 ISA 于 1979 年 由 Intel 公 司 设计 ， 目 前 同时 被 
AMPD 和 其 他 一 些 公 司 所 采用 。 其 他 一 些 著名 的 ISA 包 括 : PowerPC (IBM 和 Motorola)、PA-RISC 
(Hewlett Packard), SPARC (Sun Microsystems) 等 。 

将 高 级 语言 (WC) 翻译 为 ITSA 指 令 (如 X86) 的 过 程 ， 通 常 是 由 一 个 被 称 为 “编译 器 ” 


10 g1* 


(compiler) 9 的 程序 来 完成 的 。 例 如 ， 将 C 语 言 程序 翻译 成 x86 ISA 时 ， 需 要 一 个 “x86 的 C 编 译 器 。 
就 是 说 ， 针 对 不 同 的 高 级 语言 和 目标 计算 机 组 合 ， 需 要 一 个 对 应 的 编译 器 。 
将 特定 计算 机 的 汇编 语言 程序 翻译 为 其 ISA 的 过 程 ， 则 是 由 汇编 器 (assembly) 来 完成 的 。 


1.7.5 微 结构 


下 一 步 的 任务 是 将 ISA 转 换 成 对 应 的 实现 。 实 现 的 具体 组 织 (organization) 被 称 为 “ 微 结构 ” 
(microarchitecture)。 例 如 ， 近 年 来 许多 处 理 器 都 实现 了 X86 这 种 ISA 结 构 ， 但 每 个 处 理 器 的 实现 方 
法 不 同 ， 即 有 自己 的 微 结 构 。 最 早 的 实现 是 8088 (1979 年 )， 而 最 新 的 则 是 Pentium IV (奔腾 4， 
2001 年 ) ， 再 如 Motorola 和 IBM 已 实现 了 几 十 种 基于 Power PC ISA 的 处 理 器 ， 每 一 种 也 都 有 自己 的 
微 结 构 ， 其 中 最 新 的 两 种 是 Motorola 的 MPC7455 和 IBM 的 Power PC 750FX, 

对 于 设计 者 来 说 ， 每 次 的 新 设计 都 是 一 次 机 会 ， 设 计 者 可 以 重新 权衡 新 机 器 的 性 价 比 。 设 计 
永远 是 一 个 “权衡 ”的 挑战 练习 ， 问 题 在 于 在 高 (或 低 ) 成 本 下 ， 能 否 实现 一 个 高 (或 低 ) 性 能 
的 计算 机 。 

汽车 制造 业 为 TSA 和 微 结 构 ( 即 ISA 的 实现 ) 的 关系 提供 了 一 个 很 好 的 比喻 : ISA 描 述 的 是 驾 
车 人 在 车 里 看 到 的 一 切 ， 几 乎 所 有 的 汽车 都 提供 了 相似 的 接口 (但 汽车 的 ISA 接 口 和 轮船 、 飞 机 的 
ISA 差 别 很 大 ) ， 所 有 的 汽车 中 ， 三 个 踏板 的 定义 完全 相同 ， 即 中 间 的 是 刹车 、 右 边 的 是 油门 、 左 
边 是 离合 器 。ISA 表 达 的 是 基本 功能 ， 其 定义 还 包括 ， 所 有 的 汽车 都 能 够 从 4 点 移动 到 B 点 ， 可 前 进 
也 可 后 退 ， 还 可 左右 转向 等 。 

而 ISA 的 实现 是 指 车 盖 板 下 的 “内 容 ”。 所 有 的 汽车 其 制造 和 模型 都 不 尽 相 同 ， 这 取决 于 设计 
者 在 制造 之 前 所 做 的 权衡 决策 ， 如 有 的 制 动 系统 采用 着 车 片 ， 有 的 采用 制 动 鼓 ， 有 的 是 八 红 发 动 
机 ， 有 的 是 六 饶 ， 还 有 的 是 四 饶 ， 有 的 有 涡轮 增 压 ， 有 的 没有 。 我 们 称 这 些 差异 性 的 细节 为 一 个 
特定 汽车 的 “ 微 结构 ”， 它 们 反映 了 设计 者 在 成 本 和 性 能 之 间 所 做 的 权衡 决策 。 


1.7.6 逻辑 电路 

微 结 构 最 终 是 由 一 组 简单 的 逻辑 电路 实现 的 ， 有 多 种 实现 方法 可 供 选择 ， 各 种 方法 之 间 存 在 
着 性 能 和 成 本 上 的 差异 。 例 如 ， 仅 仅 一 全 “加 法 器 "” ， 就 存在 着 多 种 实现 ， 它 们 所 表现 出 来 的 运算 
速度 (性 能 ) 及 其 成 本 差异 非常 大 。 


1.7.7. ”器件 


最 后 要 说 明 的 是 ， 每 个 基本 的 逻辑 电路 ， 都 是 按照 特定 的 器 件 技术 (device technology) KR 
现 的 。 就 是 说 ，CMOS 电 路 中 所 使 用 的 器 件 与 NMOS 电 路 中 所 使 用 的 器 件 是 不 同 的， 它们 与 砷 化 稼 


电路 中 所 使 用 的 器 件 也 不 同 。 
1.7.8 小 结 


综 上 所 述 ， 从 用 自然 语言 对 问题 进行 描述 开始 ， 直 到 电子 (器 件 ) 的 实际 运转 ， 之 间 要 经 历 
很 多 层次 的 转换 。 如 果 我 们 能 说 “电子 ”语言 ， 或 电子 能 “ 听 懂 ”我 们 说 的 语言 ， 那 么 我 们 只 需 
要 走 到 计算 机 面前 ， 直 接 向 电子 发 布 命令 即 可 。 然 而 ， 我 们 不 会 说 电子 语言 ， 电 子 也 听 不 懂 我 们 
O “编译 器 ”是 个 广义 的 说 法 ， 有 时 又 称 为 “compiler driver”。 事 实 上 ， 为 完成 编译 工作 ， 需 要 很 多 工具 
(toolkits), ， 如 ， 预 处 理 器 (pre-processor) 、 编 译 器 (compiler)、 汇 编 器 (assembler)、 链 接 器 (linker), 

以 及 一 些 必 须 的 现成 工具 (bin-utility) 如 文档 处 理 (archiver) 等 。 一 一 译 者 注 
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的 语言 ， 我 们 所 能 做 的 事 ， 只 能 是 进行 一 系列 的 转换 。 在 转换 过 程 中 ， 每 一 层 的 实现 又 都 存在 很 
多 选择 方案 ， 面 对 不 同 的 方案 ， 我 们 的 最 终 决 策 和 选择 决定 了 系统 实现 的 性 能 和 成 本 。 


本 书 将 详细 介绍 转换 过 程 中 的 每 一 个 环节 ， 比 如 晶体 管 是 怎样 实现 逻辑 电路 的 ， 逐 辑 电 路 是 


怎样 构成 微 电 路 的 ， 以 及 微 电 路 怎样 实现 一 个 特定 的 ISA (我 们 的 ISA 是 LC-3)。 然 后 ， 从 某 个 问 
题 出 发 ， 讲 述 其 C 语 言 的 描述 ， 以 及 C 语 言 义 怎样 转换 成 LC-3 的 ISA 描 述 的 全 过 程 。 


我 们 衷心 希望 本 书 能 陪 你 度 过 一 个 恰 快 的 学 习 过 程 1 


1.8 习题 


1.1 
1.2 
1.3 
1.4 
1.5 


1.6 
1.7 


1.8 


试 解释 1.5 节 中 两 个 重要 思想 中 的 第 一 个 。 

试问 ， 同 汇编 语言 相 比 ， 高 级 语言 是 否 能 向 底层 计算 机 表述 更 多 的 计算 方式 ? 

试问 ， 是 什么 原因 使 得 模拟 计算 机 难以 实现 ， 从 而 使 设计 者 转向 采用 数字 设计 ? 

列举 自然 语言 的 特性 之 一 ， 说 明 它 为 什么 不 适合 直接 作为 编程 语言 ? 

假设 我 们 有 一 个 “黑箱 子 ”"， 其 输入 为 两 个 数字 ， 输 出 为 两 数 之 和 ， 如 图 1-7a 所 示 ， 另 外 还 有 
一 个 箱子 能 求 两 数 的 乘积 ， 如 图 1-7b 所 示 。 假 设 我 们 有 无 穷 多 个 这 样 的 箱子 ,通过 箱子 的 互 连 ， 
我 们 可 以 完成 如 p x (m + 门 这 样 的 运算 ， 如 图 1-7c， 请 问 : 怎样 通过 互 连 完成 如 下 的 计算 : 





px (m n) 
a) 加 法 b) 乘法 c) 加 法 和 乘法 组 合 
图 1-7 黑箱 子 的 功能 


a.ax+b。 

b. 求 四 个 输入 、x、y、z 的 平均 值 。 

c. à! + 2ab + b^ 《你 能 只 用 一 个 加 法 箱 和 一 个 乘 靶 箱 就 完成 吗 ?)。 
试用 自然 语言 写 一 名 话 ， 然 后 给 出 这 和 句 话 可 能 的 两 种 解释 。 
1.3.1 节 有 关 抽象 的 讨论 给 出 的 结论 是 : 如 果 “ 底 层 所 有 一 切 都 很 好 ”， 我 们 是 没有 必要 去 理解 
这 些 部 件 的 组 成 的 。 但 如 果 情 况 并 不 良好 ， 我 们 还 是 要 学 会 分 解 部 件 。 在 出 租车 的 例子 中 ， 你 
并 不 知道 怎样 才能 到 达 机 场 。 采 用 抽象 的 方法 ， 你 只 需要 简单 地 告诉 司机 “ 带 我 去 飞机 场 ” 即 
可 。 解 释 在 什么 情况 下 这 种 方法 是 有 效 的 ， 在 什么 情况 下 会 起 到 反作用 。 

Johni 说 : “Isaw the man in the park with a telescope.”。 这 意味 着 什么 ? 对 这 名 话 有 多 少 种 可 能 的 
解释 ? 请 列 出 来 。 这 句 话 具 省 的 什么 特性 ， 使 得 它 如 果 出 现在 程序 中 是 无 法 接受 的 ? 


1.9 试问， 自然 语言 可 以 表达 算法 吗 ? 
1.10 给 出 算法 的 三 个 特性 ， 并 给 出 简单 的 解释 。 
LI 针对 算法 的 每 个 特性 ， 分 别 给 出 一 个 例子 ， 在 例子 代码 中 ， 都 缺少 这 个 特性 ， 说 明 此 时 为 什 


么 不 能 说 它 是 一 个 算法 。 
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1.12 


1.13 


1.14 


gr* 





请 问 : 以 下 从 a 到 e 的 描述 是 否 是 算法 ? 如 果 不 是 ， 那 么 它 缺 乏 算法 的 哪些 特性 ? 
a. 将 下 面 第 阵 中 的 第 一 行 与 其 他 首 列 不 为 0 的 行 相 加 (注意; 列 是 垂直 方向 的 ， 行 是 水 平方 
向 的 ) ， 


b. 为 了 证 明 素 数 的 数目 和 自然 数 的 数目 一 样 多 ， 创 建 一 系列 素数 和 自然 数 的 配对 单元 ， 将 
第 一 个 素数 与 1 ( 即 第 一 个 自然 数 ) 配对 ， 第 二 个 素数 与 2 配对 ， 第 三 个 素数 与 3 配对 ， 依 次 
类 推 。 如 果 结 束 的 时 候 ， 每 个 素数 都 找到 一 个 与 其 配对 的 自然 数 ， 即 表明 素数 的 数目 和 自然 
数 的 数目 相同 ， 
c. 给 定 两 个 矢量 ， 每 个 矢量 20 个 元 素 ， 试 执行 以 下 操作 : 取 第 一 个 矢量 的 第 一 个 元 素 ， 与 
第 二 个 矢量 的 第 一 个 元 素 相 乘 ， 对 第 二 个 元 素 做 相同 的 操作 ， 依 次 类 推 。 然 后 将 所 有 的 乘积 
相 加 ( 即 点 积 (dotproduct)) ; 
d. Lynne 和 Calvin 都 想 带 小 狗 出 去 散步 ， 互 不 相让 。Lynne 于 是 拿 出 一 个 分 币 ， 提 议 抛 硬币 决 
定 ， 但 Calvin 不 相信 Lynne (怀疑 硬币 有 重量 倾向 ， 即 总 是 某 一 面向 上 )， 于 是 提出 一 个 新 的 
方案 : 

1) 连续 抛 两 次 。 

2) 如 果 第 一 次 头像 面向 上 ， 则 下 次 选 背面 。 

3) 如 果 第 一 次 背面 向 上 ， 则 下 次 选 头像 面 。 

4) 如 果 连 续 两 次 都 是 头像 面 或 背面 ， 则 重新 开始 〈 再 抛 两 次 ) 。 
l: Calvin 的 方法 是 否 符合 算法 标准 ? 
e. 给 定 一 个 数 ， 执 行 以 下 步 又 : 

1) 乘 以 4 

2) 加 4 

3) 除 以 2 

4) 减 2 

5) 除 以 2 

6) Xl 

7) 此 时 ， 给 计数 器 加 1 (表明 刚 执 行 了 一 遍 如 1~6 的 操作 步 最) ， 同 时 判断 刚才 的 减 1 结果 

(第 6 步 ) ， 如 果 为 0， 记 下 此 时 计数 器 的 值 ， 并 停止 ， 如 果 不 为 0， 则 从 该 减 过 1 的 数 开始 ， 

插 次 执行 以 上 的 1~7 步 。 

台 计 算 机 4 和 68， 除了 4 具有 减法 指令 外 ， 其 他 指令 完全 相同 。 两 者 都 具有 对 一 个 数 求 负 值 
HEG. WE: 4 和 8 两 台 计 算 机 ， 哪 一 台 能 解决 的 问题 更 多 ? 证 明 你 的 结论 。 
假设 我 们 试图 对 一 组 名 字 做 字母 排序 (sorting). APREA "Eit HEF (bubble sort)"; 
我 们 用 C 语 言 编 写 这 个 算法 ， 对 其 编译 并 运行 在 x86 ISA 的 机 器 上 ; x86 ISA 可 以 实现 为 
Pentium IV 微 结构 的 方式 。 我 们 称 这 样 一 个 序列 为 “ 冒 泡 排序 、C 语 言 编 程 、x86 ISA, 
Pentium IV 微 结构 ”的 转换 过 程 (transformation process)。 再 假设 我 们 有 四 种 排序 算 共 ， 且 可 
以 用 5 种 语言 编程 (C, C++, Pascal, Fortran, COBOL) ， 有 面向 x86 和 SPARC 两 种 ISA 的 编 
译 器 ， 且 有 三 种 x86 的 微 结构 实现 、3 种 SPARC 的 微 结构 实现 。 请 问 : 
a 共有 多 少 种 转换 过 程 ? b. 列举 其 中 三 种 转换 过 程 ， 
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1.15 
1.16 
1.17 
1.18 
1.19 
1.20 


1.21 


1.22 


1.23 
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c. 如 果 x86 的 微 结 构 是 2 种 (而 不 是 3 种 ) ，SPARC 的 微 结 构 是 4 种 (而 不 是 3 种 ) ， 那 么 共有 多 
少 种 转换 过 程 ? 

将 高 级 语言 和 底层 语言 相 比 较 ， 列 举 一 个 优点 、 一 个 缺点 。 

列举 至 少 三 个 ISA 定 义 所 包含 的 内 容 。 

简单 描述 ISA 和 微 结构 之 间 的 区 别 。 

一 种 微 结构 可 以 实现 多 少 种 ISA? 再 反问 ， 一 种 ISA 可 以 在 多 少 种 微 结构 上 实现 ? 

列 出 转换 过 程 的 所 有 层次 ， 并 在 每 层 中 找 一 个 例子 。 

图 1-6 所 示 的 转换 层次 通常 又 被 称 为 是 不 同 的 抽象 层次 。 你 认为 这 种 说 法 是 否 合理 ? 试用 例 
子 加 以 解释 。 

假设 你 去 商店 购买 字 处 理 软件 。 请 问 该 软件 通常 以 什么 方式 存在 ? 是 高 级 语言 方式 或 是 汇编 
语言 ? 或 是 与 你 的 计算 机 ISA 兼 容 的 格式 ? 请 回答 。 

假设 给 你 一 个 任务 ， 完 成 图 1-6 中 某 一 层 的 转换 工作 ， 且 只 允许 转换 为 下 面 的 一 层 (MRA 
许 “ 跨 层 转 换 ”)。 试 问 ， 你 觉得 哪 一 月 的 转换 工作 难度 最 大 ? 为 什么 ? 

为 什么 通常 会 不 断 改 变 微 结 构 实 现 却 不 改变 ISA? 例如 ，Intel 公 司 为 什么 要 确保 Pentium III 
所 实现 的 ISA 一 定 要 与 之 前 的 Pentium 一样 ? 提示 : 当 你 升级 计算 机 (如 更 换 最 新 的 CPU ) 


之 后 ， 你 希望 丢弃 原来 的 软件 吗 ? 


第 2 章 bit、 数 据 类 型 及 其 运算 


2.1 bit 和 数据 类 型 
2.1.1 bit 一 一 信息 的 基本 单位 


如 第 1 章 所 述 ， 我 们 知道 ， 计 算 机 是 一 个 包含 了 多 层 转换 的 系统 。 一 个 由 自然 语言 (如 英语 ) 
描述 的 问题 ， 最 终 必 须 转换 为 计算 机 内 部 的 电路 工作 (更 具体 地 说 是 电子 运动 )， 才 能 得 以 解决 。 

在 计算 机 内 部 ， 有 数 以 百 万 计 的 器 件 在 控制 着 电子 的 运动 。 这 些 器 件 随 时 监测 着 电路 中 各 处 
电压 的 变化 ， 并 做 出 不 同 的 响应 控制 。 它 们 不 仅 监 测 电 压 的 有 无 ， 其 至 还 能 测量 真正 的 电压 大 小 。 
但 这 无 疑 会 导致 控制 和 检测 电路 的 过 度 复杂 性 。 如 果 只 需要 检测 电路 中 任意 两 点 间 是 否 有 电压 ， 
而 不 是 测量 其 精确 电压 值 ， 电 路 的 复杂 性 无 疑 会 大 大 降低 。 

举 一 个 简单 的 例子 ， 如 果 想 知道 宝 内 插座 上 的 电压 ， 我 们 需要 专用 的 电压 表 。 这 个 电压 值 可 
能 是 120V， 也 可 能 是 115V 甚 至 是 118.6V; 但 是 ， 如 果 我 们 只 是 想 知道 插座 是 否 有 电 (而 不 关心 真 
实 电 压 值 究竟 是 以 上 三 个 中 的 哪 一 个 )， 问 题 就 简单 多 了 。 例 如 ， 我 们 有 时 在 无 意 间 把 手指 伸 入 电 
源 插 孔 里 ， 马 上 就 会 缩 回来 。 

在 符号 层 义 上 ， 我 们 采用 “1” 表 示 两 点 间 存 在 电压 ， 而 “0” 表 示 两 点 间 不 存在 电压 。 我 们 
称 这 样 一 个 要 么 是 “1” 要 么 是 “0” 的 符号 单位 为 一 个 “bitS”， 即 所 谓 的 二 进 制 表示 方法 。 回 顾 
一 下 大 家 从 孩童 时 候 就 熟悉 的 阿拉 伯 数 字 一 一 0、1、2、3、…、9， 由 这 10 个 数字 ， 我 们 可 以 表示 
任意 的 十 进 制 数 。 同 样 ， 表 示 二 进 制 数 时 ， 需 要 且 只 需要 两 个 数字 (0 和 1) 即 可 。 

确切 地 说 ， 计 算 机 对 有 电 平 (HU *1") 和 无 电 平 (Hp "0") 并 不 做 严格 的 电压 值 定义 。 换 句 话 
说 ,“0” 并 不 表示 电路 中 就 绝对 不 存在 电压 ， 它 仅仅 表示 当前 “0” 所 代表 的 电压 比 “1” 所 代表 的 
电压 更 接近 于 电压 值 0， 同 样 “1” 表 示 它 所 代表 的 电压 值 与 电压 0 的 差 值 很 大 。 例 如 ， 计 算 机 定义 
2.9V 的 电压 表示 “1”， 而 0V 电 压 表示 “0”。 但 如 果 电 路 实际 测 得 的 电压 值 为 2.6V， 计 算 机 也 会 将 它 
当做 “1” 来 处 理 ， 同 样 ， 如 果实 际 电压 为 0.2V， 计 算 机 则 将 它 当 做 “0”。 

当然 ， 计 算 机 需要 定义 足够 大 的 数值 范围 才能 工作 。 但 事实 上 ， 电 路 只 有 两 个 状态 ， 即 有 电 
E (用 “1” 表 示 ) 和 无 电压 〈 用 “0” 表 示 )。 为 了 表示 更 多 的 数值 状态 ， 我 们 可 以 将 多 条 线路 合 
并 使 用 ， 比 如 8 个 bit 宽 度 ( 即 8 条 线路 )， 这 样 就 可 以 表示 256 个 不 同 状态 (00000000~11111111)。 通 
常 ，k 个 bit 的 组 合 可 以 表达 (2*) 个 不 同 状态 ， 每 个 状态 分 别 是 上 个 0 和 1 的 bit 序 列 组 合 。 我 们 称 该 0 
和 1 的 序列 为 编码 ， 每 个 编码 对 应 一 个 特定 的 值 或 状态 。 


2.1.2 数据 类 型 

数值 的 表达 方法 多 种 多 样 ， 如 数值 5: 十 进 制 符号 表示 为 符号 “5”， 也 有 人 伸 出 5 个 手指 头 来 
表示 ， 写 出 来 就 是 “11111”( 每 个 “1” 代 表 一 个 指头 )， 这 种 方法 称 为 单 进 制 ， 罗 马 人 则 采用 字 
母 “V” 代 表 数 值 5。 下 面 ， 我 们 将 介绍 第 4 种 表示 方法 ， 也 就 是 计算 机 采用 的 二 进 制 表示 法 ， 数 值 
5 表示 为 “00000101”。 


日 ” 随 着 计算 机 知识 的 普及 ,bit 这 个 英文 单词 被 越 来 越 多 的 人 所 熟知 。 而 中 文中 ,对 bit 存 在 多 种 翻译 , 如 “位 ”、 
“比特 ”， 容 易 让 读者 感觉 混乱 。 在 后 面 的 文字 中 ， 有 了 时候 不 对 bit 做 中 文 翻译 。 一 一 译 者 注 


bit, 4E E TA JE X 15 


只 是 能 够 表达 “数值 ”还 是 不 够 的 ， 计 算 机 还 必须 具 和 操作 这 些 数值 的 能 力 。 如 果 我 们 不 仅 
定义 了 数值 的 表达 方式 (或 编码 方式 )， 同 时 还 定义 了 相关 的 操作 方法 ， 则 在 定义 上 称 该 表达 方式 
为 一 种 数据 类 型 。 每 个 计算 机 指令 集 (ISA) 都 定义 了 一 组 数据 类 型 及 其 相应 的 操作 指令 ， 数 据 类 
型 的 数目 可 多 可 少 (取决 于 ISA 的 设计 要 求 ) 。 本 书 中 ， 我 们 将 在 算术 运算 中 采用 补 码 (27s 
Complement) 编码 表示 正 、 负 整数 ， 在 键盘 输入 和 显示 器 输出 的 应 用 中 ， 采 用 ASCII 码 表示 字符 。 
关于 这 两 种 数据 类 型 ， 在 后 面 章节 中 会 有 详细 解释 。 

除 此 之 外 ， 还 存在 很 多 其 他 数值 表示 方法 。 如 高 中 化 学 课本 中 的 “科学 表示 法 ”(scientific 
notation), ， 即 将 数值 621 表 示 为 6.21 x 10?。 现 在 ， 越 来 越 多 的 计算 机 也 开始 支持 这 种 表示 方法 ， 并 
提供 相应 的 操作 指令 ， 我 们 称 之 为 “ 浮 点 ”(floating point) 数据 类 型 。 在 2.6 节 将 详细 介绍 它 。 


2.2 整数 数据 类 型 


2.2.1 无 符号 整数 


我 们 将 要 介绍 的 第 一 种 “信息 表示 方法 ”或 “数据 类 型 ”是 无 符号 整数 (unsigned integer), 
无 符号 整数 在 计算 机 中 的 应 用 非常 广泛 。 比 如 我 们 希望 限定 一 个 任务 的 执行 次 数 ， 使 用 一 个 无 符 
号 整数 即 可 ， 用 它 来 记录 该 任务 还 有 多 少 次 执行 次 数 。 另 外 ， 我 们 还 可 以 使 用 无 符号 整数 表示 不 
同 内 存单 元 的 地 址 ， 这 与 生活 中 的 用 法 很 相似 ， 如 第 129 号 大 街 或 第 131 号 大 街 。 

我 们 可 以 将 一 个 无 符号 整数 表示 为 一 连 串 的 二 进 制 数字 序列 (string of binary digits)。 为 了 更 
好 地 理解 这 种 表示 方法 ， 我 们 先 回顾 一 下 常见 的 十 进 制 数 。 

不 应 该 知道 十 进 制 数 “329” 是 什么 意思 吧 ? 这 是 一 种 “位 值 法 ”(positional notation) 表示 方 
法 ， 即 “位 置 ”决定 其 真实 “数值 ”大 小 。 如 “329”， 不 要 看 其 中 的 数字 “3” 比 数字 “9” 小 
(只 有 其 三 分 之 一 大 ), 但 “3” 的 权重 远 比 “9” 更 高 ， 因 为 在 这 里 “3” 代 表 的 是 数值 300 (3x 
10), ， 而 “9” 只 代表 9 (9x109, 

二 进 制 补 码 的 工作 原理 与 此 相同 ， 惟 一 的 不 同 只 是 使 用 的 数字 只 能 是 “0” 或 “1?， 即 基 
(base) 为 2 (而 不 是 10) 。 如 使 用 5 个 bit 来 表示 数值 “6”， 则 表示 为 “00110?， 即 

6=0x24+0x23+1x22+1x2+0x29 

有 KK 个 bit 则 可 以 表示 2 个 无 符号 整数 (从 0 到 2 二 1)。 如 上 面 的 5-bit 例 子 ， 可 表示 的 数值 范围 是 0 

到 31。 


2.2.2 有 符号 整数 


然而 ， 在 实际 算术 运算 中 存在 大 量 的 负数 。 应 该 怎样 表示 负数 呢 ? 我 们 可 以 将 24 个 人 -bit 数 一 分 
为 二 ， 一 半 表 示 正 数 ， 另 一 半 表 示 负 数 。 那 么 ， 原 先 5-bit 码 所 表示 的 0~+31 数 值 范围 ， 就 变 成 了 一 
半 代 表 正 数 “+1~+15”， 一 半 代 表 负 数 “ 一 1~ 一 15”， 共 计 30 个 整数 。 事 实 上 ，5 个 bit 可 以 表示 32 个 
码 字 ,余下 的 两 个 码 字 没有 指定 。 如 果 我 们 从 中 选择 码 字 00000 来 表示 数值 0?， 这 样 还 剩 一 个 码 字 
未 分 配 。 下 面 ， 我 们 将 讨论 如 何 处 理 这 个 多 余 的 码 字 。 

但 是 ， 我 们 仍然 面临 如 何 “ 分 配 ” 码 字 的 问题 ， 即 究竟 用 哪些 码 字 表示 正 数 、 哪 些 表示 负数 ? 

正 整 数 比 较 好 解决 ， 仍 然 采 用 “位 值 法 ”表示 。 由 于 有 k 个 bit， 可 以 表示 出 2: 个 码 字 ， 将 其 中 
的 一 半 取 出 ， 表 示 (0-2^7—1) 的 正 整 数 ， 我 们 发 现 这 些 正 整 数 的 最 高 位 bit 都 为 0(。 如 在 上 = 5 的 情 
况 中 ， 可 表达 的 最 大 正 数 是 +15， 即 01111。 . 

福 意图 2-1 中 给 出 的 三 种 数据 类 型 ， 它 们 在 表示 0 和 以 0 开始 的 正 数 时 都 完全 一 样 ， 那 么 负数 该 怎 
么 表示 呢 (以 我 们 的 5-bit 为 例 ， 为 -1 至 ~15) ? 第 一 种 思路 是 : 以 最 高 bit 代 表 符 号 ，0 为 正 数 ，1 为 
负数 ， 这 种 方法 称 为 符号 位 (Signed Magnitude) 表示 法 ， 第 二 种 思路 ， 这 也 正 是 早期 计算 机 如 
CDC6600 所 采用 ， 其 方法 是 ,将 一 个 正 数 的 所 有 bit 全 部 取 反 ， 即 得 到 该 正 数 所 对 应 的 负数 编码 ， 例 
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如 “+$” 表 示 为 “00101? ， 那 么 “-5$” 则 为 “11010”， 我 们 称 之 为 反 码 (1's Complement) 表示 法 。 

此 时 ， 读 者 可 能 认为 ， 至 于 采用 什么 编码 方法 应 完全 取决 于 设计 者 的 喜好 。 不 错 ! 但 不 幸 的 
E, 不同 的 编码 方法 会 导致 不 同 的 加 法 器 逻辑 复杂 度 。 前 面 提 到 的 两 种 编码 方法 ， 符 号 位 法 和 反 
码 ， 在 硬件 逻辑 设计 上 都 相当 复杂 。 例 如 ， 对 符号 相反 的 两 个 数 求 和 ， 加 法 器 不 能 对 它们 直接 逐 
位 相 加 。 因 此 ， 我 们 需要 设计 更 适合 硬件 操作 的 编码 方案 。 最 终 的 答案 是 补 码 (2's complement) 
表示 法 。 目 前 ， 儿 乎 所 有 的 计算 机 都 采用 这 种 编码 方式 。 


2.3 补 码 
如 图 2-1 所 示 ， 我 们 可 以 看 到 数值 -16~+15 的 补 码 (2's Complement) 表示 。 选 择 这 种 编码 ， 
其 中 的 道理 是 什么 呢 ? 





Xd m 被 表示 的 数值 
符号 位 表示 法 反 码 补 码 
00000 0 0 0 
00001 1 1 1 
00010 2 2 2 
00011 3 3 3 
00100 4 4 4 
00101 5 5 5 
00110 6 6 6 
00111 7 7 7 
01000 8 8 8 
01001 9 9 9 
01010 10 10 10 
01011 11 11 11 
01100 12 12 12 
01101 13 13 13 
01110 14 14 14 
01111 15 15 15 
10000 -0 -15 -16 
10001 -1 -14 -15 
10010 -2 -13 -14 
10011 -3 -12 -13 
10100 一 4 -11 —12 
10101 -5 -10 -11 
10110 -6 -9 -10 
10111 -7 -8 -9 
11000 一 8 -7 -8 
11001 -9 -6 -7 
11010 -10 -5 -6 
11011 -11 -4 -5 
11100 -12 -3 一 4 
11101 -13 -2 -3 
11110 -14 -1 -2 
-1 


nl -15 -0 
图 2-1 有 符号 整数 (signed integer) 的 三 种 表示 方法 9 


蝗 ” 对 于 符号 位 表示 法 (Signed Magnitude)， 高 位 取 反 即 为 负数 ， 对 于 反 码 (1's Complement) 所 有 位 取 反 ， 
对 于 补 码 (2's Complement) ， 负 数 =2" 一 1。 一 一 译 者 注 
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我 们 看 到 ， 正 数 的 编码 方案 比较 直接 。 以 5-bit 为 例 ， 整 个 (3) 编码 空间 的 一 半 用 于 代表 数值 
0 和 1~24--1 的 正 整数 。 
有 关 负 数 表示 方法 的 选择 ， 如 前 所 述 ， 应 遵循 使 逻辑 电路 尽量 简单 的 原则 。 几 乎 所 有 的 计算 
机 都 采用 相同 的 实现 机 制 完成 加 法 运算 ， 即 算术 带 辑 运算 单元 (Arithmetic and Logic Unit, ALU), 
我 们 将 在 第 3、4 章 详细 介绍 ALU 的 结构 ， 现 在 我 们 只 需要 知道 它 有 两 个 输入 和 一 个 输出 ， 它 的 功 
能 就 是 将 两 个 二 进 制 数 输入 按 位 相 加 ， 并 在 输出 端 给 出 结果 。 
仍然 以 5-bit 输 入 模式 (pattern) 的 二 进 制 数 为 例 ， 假 设 两 个 输入 分 别 为 00110 和 00101， 则 
ALU 应 输出 01011 ， 即 
00110 
00101 
01011 
二 进 制 数 的 加 法 规则 与 十 进 制 加 法 完全 相同 。 从 右 向 左 将 两 数 按 列 对 齐 并 依次 相 加 ， 如 果 前 
列 的 加 法 产生 进位 ， 则 该 进位 bit 参 加 其 左边 列 的 加 法 操作 。 
值得 一 提 的 是 ，ALU 不 知道 也 不 关心 它 的 两 个 输入 数 所 代表 的 任何 含义 。 换 名 话说 ， 它 只 
会 对 两 个 二 进 制 数 做 加 法 (ADD) 而 不 考虑 其 他 (如 正 数 、 负 数 等 因素 )。 这 意味 着 我 们 必须 
为 它 选择 一 个 合适 的 编码 方式 ， 以 保证 无 论 输入 数 是 什么 形式 ， 它 都 将 产生 正确 结果 。9S 
下 面 我 们 分 析 正 确 执行 时 对 编码 方式 的 要 求 。 首 先 ， 绝 对 值 相 同 但 符号 相反 的 两 个 数 之 和 应 
该 为 0。 换 句 话 说， 对 于 任意 两 个 非 0 的 整数 -~-A 和 A， 在 特定 的 编码 方式 下 ，ALU 对 它们 的 加 法 结 
果 应 该 为 00000。 . 
显然 ， 补 码 表示 法 满足 以 上 要 求 ， 即 补 码 方式 就 是 按照 这 个 条 件 要 求 为 每 个 负数 分 配 码 字 的 。 
例如 ， 整 数 +5 的 码 字 是 00101， 则 一 5 的 码 字 就 是 11011。 
另外 ， 补 码 更 重要 的 一 个 特征 是 ， 如 果 将 数值 -15 到 +15 的 各 个 码 字 顺 序 排 开 ， 相 邻 两 个 码 字 
之 间 差 值 正好 为 00001。 下 面 我 们 用 数学 的 方式 表示 这 个 现象 ; 


REPRESENTATION (value + 有 = 
REPRESENTATION (value) + REPRESENTATION(1). 


Xr, REPRESENTATION (value) 代表 数值 value 所 对 应 的 码 字 。 由 此 我 们 发 现 ， 只 要 数值 
不 大 于 15 或 小 于 -16，ALU 首 能 保证 正确 的 加 法 结果 。 

注意 其 中 数值 Oo 和 一 1 的 码 字 ， 即 11111 和 00000。 当 我 们 知道 对 数值 1 做 加 00001 的 操作 时 ， 我 
们 看 到 ALU 的 输出 结果 确实 为 00000， 但 同时 还 有 一 个 进位 。 由 于 进位 对 结果 不 产生 影响 SS， 所 以 
我 们 说 -1 在 加 00001 之 后 的 结果 是 0， 而 不 是 100000。 在 此 ， 进 位 bit 被 丢弃 了 ， 而 事实 上 在 补 码 运 
算 中 ， 进 位 bit 始 终 是 被 忽略 的 。 

提示 : 在 补 码 表示 中 ， 如 果 已 知 一 个 非 零 整数 A 的 码 字 ， 可 以 很 方便 地 求 得 其 相应 负数 一 A 的 
码 字 。 换 算 口 诀 是 : 取 反 加 1。 即 将 A 的 码 字 按 位 取 反 ， 求 得 A 的 反 码 (即位 补 码 )， 再 对 A 反 码 加 1， 
即 求 得 一 A 的 补 码 。 我 们 对 照 之 前 的 规则 验证 一 下 对 于 任意 A， 它 与 其 反 码 之 和 总 为 11111， 如 果 
我 们 将 00001 与 11111 相 加 ， 结 果 显 然 为 00000。 从 而 证 明了 在 补 码 方式 下 ，A 与 ~A 之 间 的 码 字 换算 
口诀 是 正确 的 。 





© XE “Since the binary ALU only ADDs and does not CARE”， 这 就 如 同 我 们 常 说 的 ， 它 只 管 做 事 而 不 问 
为 什么 ， 或 者 说 它 只 是 一 个 “机 制 "， 而 “策略 ”由 上 层 制 定 。 一 一 译 者 注 

© ”所谓 “进位 (camy) 对 结果 不 产生 影响 ”， 可 以 理解 为 我 们 读 ALU 的 输出 结果 时 ， 只 会 去 读 那些 有 效 位 〈 如 
本 例 中 的 5-bit 有 效 位 )， 而 “最 高 位 ”所 产生 的 进位 ， 通 常 被 用 做 控制 (而 不 是 运算 ) 目的 。 一 一 译 者 注 
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通过 以 上 验证 ， 我 们 看 到 在 5-bit ALU 情 况 下 ，01101 和 10011 的 和 为 00000， 同 时 ALU 还 将 产 
生 一 个 进位 。 就 是 说 ， 事 实 上 01101 和 10011 的 求 和 结果 应 该 是 100000。 正 如 之 前 所 述 ， 在 补 码 运 


算 中 ， 该 进位 bit 将 被 丢弃 。 
至 此 ， 在 我 们 的 5-bit 系 统 中 ， 已 解决 了 数值 0 和 15 个 正 数 及 其 对 应 的 15 个 负数 的 补 码 编码 分 配 


问题 。 总 共 使 用 了 15+15+1=31 个 码 字 ， 我 们 知道 5-bit 可 以 表示 2’=32 个 码 字 ， 那 么 ， 剩 下 一 个 码 字 


10000 怎 么 分 配 值 呢 ? 
我 们 注意 到 一 1 的 码 字 是 11111， 一 2 是 11110， 一 3 是 11101， 依次 类 推 。 En. 我 们 发 现 ， 一 15 的 


码 字 是 10001， 如 果 将 10001 继 续 减 1， 则 得 到 10000。 所 以 ， 顺 应 ALU 的 操作 方式 ， 我 们 可 以 让 码 


字 10000 对 应 为 数值 一 16。 
在 第 5 章 中 ,我 们 将 介绍 一 个 被 称 为 LC-3 (LC 代表 Little Computer). 的 计算 机 。LC-3 将 采用 
16-bit 补 码 方 式 ， 因 此 LC-3 的 数值 表示 范围 为 从 一 32 768 到 +32 767 之 间 的 所 有 整数 。 


2.4 二进制 数 与 十 进 制 数 之 间 的 转换 


由 于 计算 机 采用 二 进 制 来 表示 数据 ， 而 生活 中 人 们 普遍 采用 十 进 制 数 ， 因 此 二 进 制 数 和 十 进 
制 数 之 间 的 转换 就 显得 非常 必要 。 
2.4.4. 二 进 制 数 转换 为 十 进 制 数 

从 二 进 制 到 十 进 制 的 转换 过 程 如 下 : 以 8-bit 数 据 为 例 ， 其 补 码 表示 对 应 的 数值 范围 是 
一 128~+127。 可 以 将 一 个 8-bit 二 进 制 数 表示 如 下 : 

i 4, 4505 0404 0; d, dg 

其 中 ,任意 位 a 的 值 为 0 或 1。 转 换 步 骤 如 下 : 

(1) 符号 检查 与 转换 。 如 果 符 号 位 a; = 0， 表 示 该 值 为 正 数 ， 则 继续 ， 而 如 果 a, = 1， 表 示 该 
值 为 负数 ， 我 们 需要 先 将 其 转换 为 绝对 值 相同 的 正 数 的 补 码 〈 稍 后 将 补 一 个 负 号 ) 。 

(2) 绝对 值 的 计算 很 简单 ， 求 下 面 的 多 项 式 之 和 即 可 : 

asx 26 +asX25+ax2+a xP +a Xx +a x2 + ax 2 


(3) 如 果 该 值 为 负 〈 参 见 1) ， 我 们 只 要 在 绝对 值 的 前 面 加 上 负 号 即 可 。 
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2.4. 十 进 制 数 转换 为 二 进 制 数 


从 十 进 制 数 转换 为 二 进 制 数 ， 要 稍微 复杂 一 点 。 下 面 的 现象 反映 了 其 中 的 窍门 ， 如 果 一 个 二 
进 制 数 是 奇数 ， 那 么 它 的 最 低位 必然 是 1， 如 果 为 偶数 ， 则 最 低位 是 0。 

仍然 以 8-bit 二 进 制 数 为 例 ， 一 个 8-bit 二 进 制 数 可 以 表示 为 如 下 的 多 项 式 : 

A7X2 eaux 25 c a,x 2 taxX2+axX2 +a x? +a x2 c ayx 22 

我 们 还 是 以 一 个 具体 例子 来 讲述 它 到 十 进 制 的 转换 过 程 。 

假定 十 进 制 数 为 +105， 我 们 将 其 转换 为 对 应 的 二 进 制 数 。 由 于 该 数 为 正 数 ， 所 以 上 述 多 项 式 
中 的 ao 必然 为 0。 - 

剩 下 的 任务 就 是 求解 满足 下 列 等 式 的 所 有 aw 值 (i = 0-6); 

105 =aX 26 +a, x25 +a, x2 «ax cax2 a, x2! + agx 22 
由 于 105 是 奇数 ， 因 此 ao 的 取 值 为 1。 然 后 从 等 式 的 两 端 同 时 减 去 1， 又 得 : 
104 =a X 26 +a; X 2 ca,x2*5*ca,x2 +a, X? +a x2! 
将 上 面 等 式 两 端 同时 除 以 2， 则 得 ;: 
S$2=ax25+0x24+04X234+0X22+ax21+aX22 

由 于 52 是 偶数 ， 因 此 最 低 因 子 a 必然 为 0。 

如 此 迁 代 ， 每 次 都 将 等 式 两 端 同 时 减 去 最 低位 的 数值 (0 或 1)， 然 后 除 以 32， 即 可 求 出 所 有 的 a 
值 。 下 面 继续 : 

52 =a; X Z *tay,x2'«a,x2 +a x2? ca,x2! 
处 理 后 得 
26 =a;x 2 +a; x? +a,Xx 2? +a; x2 +a, x2? 
因此 ，a; 为 0。 
13 = as X Z’ + a; X 2? + a,x 2! + a x 2° 
因此 ，a; 为 1。 
6=asxX2+asxX2!+asx2° 
因此 ，a4 为 0。 
3=asx2!+asx2° 
因此 ，a; 为 1。 
=a x2 

因此 ，ek 为 1。 最 后 求 得 二 进 制 数 为 01101001。 

总 结 一 下 这 个 过 程 。 假 定 一 个 十 进 制 数 的 绝对 值 为 N， 则 其 二 进 制 数 求解 过 程 如 下 : 

(1) 先 将 十 进 制 数 N 展 开 为 如 下 等 式 : 

N=asx2 +asxX2 +ax2+tax2 +ax2+ax2 c ayx 2 

然后 反复 执行 以 下 操作 过 程 ， 直 到 等 式 左边 变 成 0: 

a. 如 果 N 为 奇数 ， 则 右边 最 低位 a 为 1!。 如 果 N 为 偶数 ， 则 右边 最 低位 a 为 0。 

b. 然后 将 等 式 两 端 同 时 减 去 1 (N 为 奇数 ) 或 0 (N 为 偶数 )， 消 除 最 低位 。 之 后 ， 将 等 式 两 端 
同时 除 以 2。 

每 执行 一 次 ， 可 以 求 得 一 个 a 的 值 。 

(2) 最 后 ， 如 果 N 值 为 正 ， 则 ay 取 值 为 0， 完 成 。 

(3) 如 果 N 值 为 负 ， 则 最 高 位 补 0， 然 后 求 该 码 字 的 补 码 ， 完 成 。 
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2.5 bit 运 算 之 一 : 算术 运算 
2.5.1 加 法 和 减法 


二 进 制 补 码 的 算术 运算 与 我 们 常用 的 十 进 制 算术 运算 非常 相似 。 
加 法 运算 仍然 是 按 位 对 齐 ， 从 右 向 左 依次 计算 。 所 不 同 的 是 ， 十 进 制 算 术 运 算是 满 十 进 一 
(因为 每 位 最 大 数 是 9) ， 而 二 进 制 算术 运算 则 是 满 二 进 一 〈 每 位 最 大 数 是 1)。 


减法 可 以 理解 为 就 是 加 法 ， 如 A 一 B 等 价 于 A+(-B)。 





2.5.2 符号 扩展 


在 一 些 情况 下 ， 为 了 减少 占用 空间 ， 较 小 的 数值 会 采用 较 少 的 bit 来 表示 或 存放 。 例 如 ， 数 值 5 
与 其 表示 为 0000000000000101， 还 不 如 用 6 个 bit 表 示 为 000101。 这 个 表述 可 能 让 你 有 些 困惑 了 。 事 
实 上 ， 我 们 是 想 说 明 这 样 一 个 事实 ， 通 常 在 一 个 数 前 面 补 上 0， 并 不 会 改变 它 的 值 。 例 如 ， 支 票 上 
的 金额 写 为 $456.78 与 写 为 $0000456.78 之 间 没 有 任何 区 别 。 

那么 ， 对 于 负数 呢 ? 我 们 以 数值 -5 为 例 ， 如 果 我 们 用 6-bit 来 表示 ， 数 值 3 等 于 000101，--5 则 
29111011, 如 果 我 们 用 16-bit 来 表示 ， 数值 5 为 0000000000000101， 一 5 则 为 1111111111111011。 我 
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们 发 现 ， 如 同 在 正 数 前 面 加 0 一 样 ， 在 负数 前 面 加 1 也 不 改变 其 值 。 
下 面 ， 我 们 看 两 数 相 加 的 操作 。 我 们 发 现 ， 如 果 将 两 个 表示 长 度 不 等 的 二 进 制 数 直接 相 加 ， 
将 存在 一 些 问 题 。 例 如 ， 计 算 13 和 一 5 两 数 的 和 。 基 中 ， 将 13 表 示 为 0000000000001101， 而 -5 表示 
为 111011。 那 么 ALU 计 算出 来 的 结果 是 什么 呢 ? 
0000000000001101 
+ i011 
问题 出 现 了 ， 我 们 应 该 如 何 处 理 111011 中 缺少 的 位 呢 ? 如 果 我 们 把 那些 缺 省 位 填 为 0， 那 么 与 
+13 相 加 的 数 将 不 再 是 -5， 为 什么 ? 因为 0000000000111011 代 表 的 是 +59。 这 样 ， 计 算出 来 的 结果 
将 是 +72， 显 然 是 错误 的 。 
然而 ， 如 果 我 们 意识 到 数值 -5 的 6-bit 表 示 与 16-bit 表 示 之 间 的 差异 〈 即 高 位 那些 看 来 无 意义 的 
1) ， 并 将 其 6-bit 码 字 做 符号 扩展 ， 转 换 为 16-bit， 则 计算 式 如 下 所 示 ， 
0000000000001101 
+1111111111111011 
0000000000001000 


于 是 ， 结 果 正 确 ， 即 +8。 

通过 以 上 例子 ， 我 们 得 出 结论 : 在 二 进 制 正 数 前 面 添加 任意 多 的 0 不 会 改变 其 值 ， 同 样 ， 在 负 
数 前 面 添 加 任意 多 的 1( 即 符号 扩展 ) 也 不 会 影响 其 值 。 我 们 称 这 两 种 操作 为 “符号 扩展 ”(Sign- 
Extension), ， 简 称 SEXT。 符 号 扩展 主要 应 用 在 两 个 不 同 长 度 的 二 进 制 数 相 加 的 场合 。 


2.5.3 溢出 

到 目前 为 止 ， 所 遇 到 的 运算 结果 都 还 未 遇 到 超出 码 字 的 最 大 值 或 最 小 值 的 情况 ， 如 果 超 过 ， 
将 怎么 处 理 呢 ? 

你 一 定 熟 悉 汽 车 仪表 盘 上 的 里 程 表 ， 它 的 作用 是 记录 汽车 已 行驶 的 英里 数 。 在 老式 的 汽车 上 ， 
如 果 里 程 表 的 当前 值 为 99992， 则 汽车 又 行驶 100 英 里 后 ， 读 数 将 变 为 00092。 这 是 因为 里 程 表 能 够 
记录 的 最 大 值 为 99999， 从 而 将 实际 的 100092 显 示 为 00092， 即 最 高 位 的 进位 被 丢失 了 。 

这 时 我 们 称 里 程 表 溢出 了 。 随 着 技术 的 进步 ， 现 在 的 汽车 大 都 能 行驶 到 1 000 000 英 里 以 上 ， 
于 是 汽车 制造 商 觉得 有 必要 在 里 程 表 上 再 多 加 一 位 。 也 就 是 说 ， 现 在 的 汽车 要 行驶 到 1 000 000 
英里 后 才 会 溢出 。 

汽车 里 程 表 是 一 个 典型 的 无 符号 整数 运算 器 ， 每 单位 行程 之 后 ， 它 都 将 累加 一 个 正 数 。 例 如 ， 
如 果 当 前 里 程 表 读 数 是 000129， 则 行驶 50 英 里 之 后 ， 其 读数 将 变 成 000179， 只 有 当 最 高 位 进位 时 ， 
才 出 现 溢出 。 

相 比 之 下 ， 有 符号 整数 运算 的 溢出 问题 就 要 复杂 一 些 了 。 仍 然 以 5-bit 二 进 制 补 码 为 例 ， 我 们 
已 知 5-bit 码 字 的 表达 范围 是 -16~+15。 如 果 计 算 (+9)+(+11) 的 运算 结果 ，+9 的 二 进 制 形式 为 01001， 
+11 的 二 进 制 形式 为 01011， 则 

01001 
+ 01011 
10100 

结果 是 一 个 负数 (最 高 位 或 符号 位 为 1 )， 显 然 出 错 了 。 这 是 因为 (+9) + (+11) 的 结果 超出 
了 5-bit 补 码 所 能 表示 的 最 大 正 整 数 0111 (或 +15)， 而 我 们 的 运算 结果 超过 了 这 个 最 大 值 ， 导 致 进 
位 冲 入 了 符号 位 的 bit。 结 果 过 大 ， 导 致 洲 出 问题 ， 其 检测 机 制 很 容易 实现 。 因 为 两 个 正 数 相 加 ， 
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结果 必然 也 是 正 数 ， 而 如 果 ALU 给 出 的 结果 是 一 个 负数 ， 显 然 出 错 了 。 在 计算 机 中 ， 我 们 称 这 种 
故障 现象 为 “溢出 。 
再 看 负数 的 运算 。 例 如 ， 表 达 式 (一 12) + (-6)。-12 的 补 码 为 是 10100，--6 的 补 码 是 11010， 
Bl : 
10100 
i 11010 
01110 
也 出 现 错误 了 ! 这 是 因为 (712) + (76) 的 结果 小 于 5-bit 补 码 所 能 表达 的 最 小 值 (716), fu) 
样 也 将 产生 最 高 位 进位 ， 进 而 导致 符号 位 被 “破坏 ”。 两 个 负数 的 和 必然 也 是 负数 ， 而 溢出 后 的 值 
却 是 一 个 正 数 。 同 样 ， 通 过 运算 结果 和 两 个 运算 数 之 间 的 符号 位 比较 ， 很 容易 发 现 溢出 问题 。 
注意 ， 前 面 的 两 个 溢出 例子 都 发 生 在 同 符号 数 相 加 的 情况 下 。 事 实 上， 也 只 有 在 这 两 种 同 符 
号 运算 情况 下 ， 才 会 发 生 溢 出 。 一 个 正 数 和 一 个 负数 相 加 ， 永 远 都 不 会 溢出 ， 参 见习 题 2.25。 


2.6 bit 运算 之 二 : 逻辑 运算 


前 面 介 绍 的 是 二 进 制 算术 运算 ， 如 加 法 、 减 站 。 本 节 将 介绍 二 进 制 数 的 另 一 类 重要 运算 ， 即 
i$ 8i& X. (Logical Operation), 

还 辑 运算 符 的 操作 对 和 象 是 轴 辑 变量。 届 辑 变量 的 取 值 只 有 两 个 ， 0x1, "ERU (logical) 这 
个 名 词 的 命名 是 个 历史 产物 ; 在 此 ， 我 们 只 是 使 用 0 和 1 这 两 个 数 来 代表 逻辑 值 中 的 “ 假 ”(flase ) 
和 “页 ”(true)， 而 逻辑 运算 与 “逻辑 ” 原 有 的 含义 已 相去 甚 远 。 

逻辑 运算 由 几 个 基本 运算 组 成 ， 大 多 数 ALU 都 具备 这 些 功能 。 
2.6.1 “与 ”运算 

“与 9”(AND) 是 一 个 二 元 逻辑 运算 ， 这 意味 着 它 需 要 两 个 源 操 作 数 ， 且 每 个 操作 数 的 取 值 
要 么 为 0、 要 么 为 1。 如 果 两 个 源 操作 数 同 为 1， 则 AND 的 输出 结果 为 1， 否 则 ， 结 果 皆 为 0。 

逻辑 操作 的 功能 (或 行为 ) 定义 的 常用 描述 方式 是 “ 真 值 表 ”(truth table)。 真 值 表 的 行 数 和 
列 数 分 别 为 2 和 n+1。 前 n 列 分 别 代表 n 个 源 操作 数 ， 由 于 每 个 源 操 作 数 都 是 逻辑 变量 ， 变 量 值 只 可 
能 为 0 或 1， 所 以 a 个 源 操作 数 的 所 有 可 能 组 合 数 目 为 2x。 真 值 表 中 的 每 一 行 代表 了 一 种 组 合 ， 表 的 
最 后 一 列 代表 该 组 合 方式 下 的 逻辑 运算 结果 。 

以 两 输入 AND 单 元 为 例 ， 真 值 表 中 有 两 列 ， 分 别 对 应 两 个 源 操作 数 ， 而 行 数 为 4 (22) ， 对 应 
不 同 的 逻辑 组 合 。 


4 B AND 
0 0 0 
0 l 0 
1 0 0 
1 1 1 


我 们 也 可 以 对 两 个 长 度 为 m-bit 的 二 进 制 数 做 AND 运 算 ， 即 将 两 个 操作 数 按 位 对 齐 ， 然 后 对 其 
中 的 每 一 对 bit 进 行 AND 运 算 。 在 下 面 的 例子 中 ，a 和 4b 都 是 16-bit 二 进 制 数 ，c 是 a 和 b 之 间 相 与 的 结 
果 。 我 们 将 这 种 操作 称 做 校 位 AND 操 作 。 


O AND 的 中 文 说 法 是 “与 "， 如 “与 操作 ”、“ 与 门 ”等 。 但 为 了 避免 在 字面 上 出 现 混淆 (如 误 读 做 连接 词 
“与 ”)， 所 以 在 后 面 的 文字 中 ， 有 时候 直 接 使 用 AND 符 号 表示 “与 ”操作 或 “与 ”逻辑 单元 。 一 一 译 者 注 
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2.6.2 “或 ”运算 

"m" (OR) 也 是 一 个 二 元 逻辑 运算 ， 它 的 两 个 源 操作 数 都 是 逻辑 变量 ， 取 值 为 0 或 1。 仅 当 两 
个 源 操 作 数 都 为 0 时 ，OR 的 输出 结果 才 为 0， 其 他 情况 下 ，OR 输 出 都 为 1。 换 名 话说， 两 个 源 操作 
数 中 任意 一 个 为 1， 则 OR 结 果 必 然 为 1。 


OR 运 算 的 真 值 表 如 下 所 示 : 
4 B OR 
0 0 0 
0 1 1 
1 0 1 


1 1 1 | . 
与 AND 运 算 类 似 ， 我们 也 可 以 在 两 个 m-bit 和 的 二 进 制 数 之 间 执 行 按 位 OR 运算 。 
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2.6([3 "dE" iE 
"JF" (NOT) 运算 是 一 元 逻辑 运算 ， 这 意味 着 它 只 需要 一 个 源 操作 数 。 该 运算 又 被 称 为 “ 补 ” 
(complement) 运算 ， 即 输出 是 输入 求 补 的 结果 。 有 时 候 我 们 又 称 该 输出 是 输入 的 “ 反 (inverting) 
操作 ”。 如 果 输 入 A 为 1， 则 输出 为 0， 如 果 输 入 A 为 0， 则 输出 为 1。 


NOT 运 算 的 真 值 表 如 下 所 示 : 
A NOT 
0 1 
1 0 


同样 ，NOT 运 算 也 可 以 像 AND 和 OR 运算 一 样 ， 对 m-bit 的 数 进行 按 位 (bit-wise) NOT 操 作 。 
假设 a 的 取 值 如 前 面 的 例子 所 示 ， 则 c 每 位 的 值 是 对 应 位 取 反 的 结果 ， 如 下 所 示 ， 
a 0011101001101001 
c 1100010110010110 


2.6.4 “ 异 或 ”运算 
“ 异 或 ”(exclusive-OR ) ， 简 称 XOR ， 也 是 一 个 二 元 逻辑 运算 。 同 样 ， 它 也 需要 两 个 源 操作 数 ， 


且 每 个 逻辑 变量 的 取 值 或 为 0， 或 为 1。 如 果 两 个 输入 值 不 同 ， 则 XOR 输 出 为 1， 如 果 两 者 相同 ， 则 
XOR 输 出 为 0。XOR 的 真 值 表 如 下 所 示 : 


A B XOR 
0 0 0 
0 1 1 
1 0 1 
1 1 0 


我 们 采用 和 AND 运 算 相同 的 方法 ， 对 两 个 m-bit 二 进 制 数 进行 按 位 XOR 运 算 。 





2.7 其 他 类 型 


除 整 数 类 型 外 ， 通 常 我 们 还 会 遇 到 如 位 矢量 (bit vector) 、 浮 点 数 (float-point), 、ASCII 码 和 
十 六 进 制 (HEX) 等 数据 类 型 。 本 节 将 对 它们 进行 介绍 。 
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2.71 位 矢量 


在 很 多 复杂 系统 中 ， 包 含 了 许多 独立 单元 ， 每 个 单元 或 已 或 空 用 。 璧 如 ， 一 个 制造 车 间 里 的 
每 一 台 机 器 ， 又 如 出 租车 网 络 中 的 每 辆 出 租车 ， 它 们 都 是 系统 中 独立 的 组 成 单元 。 重 要 的 是 ， 我 
们 必须 从 各 个 单元 中 判断 并 选取 那些 空闲 的 单元 ， 以 便 我 们 为 其 分 配 任务 。 

假设 存在 2 个 单元 ， 我 们 可 以 用 一 个 mbit 的 二 进 制 数 代表 这 ?个 单元 。 当 某 个 单元 空闲 时 ， 我 
们 将 相应 的 bit 清 0， 当 某 个 单元 忙碌 时 ， 我 们 将 相应 的 单元 置 1。 我 们 称 这 个 二 进 制 数 为 “位 矢量 ” 


(bit vector), 






2.7.2 浮 点 数 


本 书 中 大 多 数 的 例子 都 是 基于 整数 的 运算 。 在 LC-3 中 ， 整 数 的 表示 方法 是 16-bit 补 码 ， 其 中 15 
位 表示 它 的 数值 (绝对 值 ) ， 最 高 的 1 位 则 用 来 代表 该 整数 的 符号 。 因 此 ，LC-3 能 表示 的 数值 范围 
是 整数 -25~25-1 ( 即 -32 768-32 767), ， 我 们 称 LC-3 的 数值 表示 精度 (Precision) 是 15 位 ， 范 围 
(range) 是 25。 但 在 很 多 情况 下 ， 我 们 要 表示 更 大 的 数值 ， 如 6.023 x 10” (ERKKO), RR 
个 数 超过 了 16-bit 二 进 制 数 的 表达 范围 。 其 实 ， 更 重要 的 是 能 够 表达 6 023 这 个 4 位 十 进 制 数 。 

问题 是 ， 我 们 需要 更 多 的 bit 才 能 保证 对 这 个 数 的 表示 精度 。 

浮 点 数 的 引入 解决 了 这 个 问题 。 在 浮 点 表示 法 中 ， 除 符号 位 之 外 ， 并 不 是 将 所 有 bit 都 用 于 精 
度 表示 ， 而 是 一 部 分 bit 用 于 表达 数值 范围 (多 大 、 多 小 )， 另 一 部 分 用 于 表示 数值 精度 。 

大 多 数 的 指令 集 都 定义 了 一 种 或 多 种 浮 点 数 类 型 。 其 中 之 一 通常 被 称 做 “float” 类 型 ， 由 32- 
bit 组 成 ， 各 bit 的 定义 如 下 : 

FI: Ibit, REFS (ERRAR) 

数值 范围 ， 8bit， 代 表 范 围 (指数 ，exponent) 

数值 精度 : 23bit， 代 表 精 度 (尾数 部 分 ，fraction) 


日 摩尔 (mole) 是 一 个 数量 单位 ， 如 “1 mole of H,O = 6.023 x 10? molecules of H,O”( 和 参考 wei) 。 该 常数 又 
称 为 Avogadro 常 数 ， 意 大 利 科学 家 Amedeo Avogadro (1778-1850) 于 1811 年 提出 :“ 在 相同 温度 、 压 力 下 ， 
相同 体积 的 不 同 气 体 包含 相同 数目 的 气体 分 子 ， 在 标准 状态 下 ， 这 个 数目 就 是 6.023 x 10””。 由 于 分 子 的 
英文 是 molecule， 访 单位 由 此 而 得 名 。 一 一 译 者 注 l 
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几乎 所 有 的 计算 机 制造 商都 使 用 如 图 2-2 所 示 的 float 格 式 ， 该 格式 也 是 IEEE 浮 点 运算 标准 的 一 
部 分 。 


1 <—8—>| < 23 一 一 


指数 (exponent) 尾数 (fraction) 


N=(-1)x1 尾 数 x2 指数 -127 04. os 
图 2-2 浮 点 数 类 型 


这 种 浮 点 数 表示 法 和 我 们 中 学 课本 中 的 科学 计数 法 (scientific notation) 非常 相似 ， 如 6.023 x 
10” 就 是 科学 计数 法 的 例子 。 在 科学 计数 法 中 ， 有 三 个 基本 组 成 : 符号 (默认 为 +)、 有 效 数字 
(6.023)、 指 数 (23)， 我 们 称 其 中 的 有 效 数字 为 尾数 (fraction)。 注 意 ， 在 浮 点 表示 法 中 ，fraction 
将 被 正则 化 《normalized)， 即 小 数 点 左边 有 且 仅 有 一 个 非 零 数 十进制 )。 

浮 点 数 (如 图 2-2 所 示 ) 也 由 相同 的 三 部 分 组 成 。 与 科学 计数 法 中 的 4 个 十 进 制 尾数 相 比 较 ， 
浮 点 数 的 尾数 长 度 是 23 个 二 进 制 数字 。 注 意 ， 尾 数 部 分 是 被 正则 化 的 ， 即 小 数 点 左边 有 且 仅 有 一 
位 非 0 数 字 ， 但 二 进 制 方 式 下 ， 这 个 非 0 数 字 只 可 能 是 1， 所 以 这 个 1 就 不 必 表 示 出 来 了 。 因 而 ， 只 
要 23bit 就 能 表示 24 位 的 精度 。 换 名 话说， 在 IEEE 标 准 中 ， 那 个 必然 存在 的 1 被 省 略 了 。 

关于 指数 部 分 与 6.023 x 10” 中 的 两 位 十 进 制 指数 不 同 的 是 ，IEEE 浮 点 数 使 用 了 23 位 (二 进 
H) 表示 指数 。 两 者 的 不 同 还 表现 为 : 科学 计数 法 采用 的 基数 (radix) 为 10， 而 IEEE 浮 点 数 的 基 
数 为 2，8-bit 的 指数 字段 可 以 表示 256 个 不 同 的 指数 值 。 但 图 2-2 却 指出 指数 值 范围 是 1~254， 那 么 
剩余 两 个 指数 值 00000000 和 11111111 代 表 什么 意思 呢 ? 图 2-2 中 对 此 未 给 出 任何 解释 ， 我 们 将 在 本 
节 最 后 给 出 答案 。 

对 浮 点 数 中 指数 字段 的 254 个 取 值 ， 解 释 如 下 : 实际 的 指数 值 等 于 该 无 符号 整数 减 127 之 后 的 
结果 。 例 如 ， 如 果实 际 指数 值 是 +8， 那 么 指数 部 分 则 表示 为 10000111 ( 即 无 符号 数 135) ， 因 为 
135—127 = 8。 如 果实 际 指数 值 是 -125， 那 么 指数 部 分 则 表示 为 00000010 ( 即 无 符号 数 2) ， 因 为 
2—127 = —125, 

最 后 一 个 字段 是 符号 位 : 0 代表 正 数 ，1 代 表 负 数 。 公 式 中 ， 系 数 (-1)* 意 味 着 如 果 s = 0, RITE 
号 为 1， 若 * = 1， 则 为 -1。 
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有 关 IEEE 浮 点 数 标准 的 深入 理解 ， 已 超出 本 书 要 求 。 事 实 上 ， 我 们 连 指数 字段 为 11111111 的 
32-bit 浮 点 数 的 含义 是 什么 都 没有 讲 ， 也 不 准备 讲 了 。 我 们 讲述 浮 点 数 的 意图 ， 只 是 想 让 你 知道 ， 
除了 补 码 整 数 外 ， 还 存在 一 种 非常 重要 的 (几乎 所 有 的 ISA 都 具备 的 ) 数据 类 型 。 这 种 数据 类 型 就 
是 浮 点 数 ， 它 既 可 以 表达 非常 大 的 数值 ， 也 可 以 表达 非常 小 的 数值 ， 只 是 牺牲 一 些 数值 精度 而 已 。 


2.7.3 ASCII 码 


另外 一 类 信息 表示 方法 也 是 大 多 数 计算 机 设备 厂家 都 遵循 的 ， 它 是 一 种 用 于 在 计算 机 处 理 单 
元 和 输入 /输出 设备 之 间 传递 “字符 ”(character) 的 编码 标准 。 这 种 8-bit 编 码 方式 被 称 做 ASCII 码 。 
ASCII 代 表 美 国信 息 互 换 标准 码 (American Standard Code for Information Interchange) ， 它 的 存在 
为 计算 机 厂家 、 设 备 厂 家 (生产 键盘 、 显 示 器 等 设备 ) 之 间 提 供 了 一 个 定义 字符 格式 的 共同 标准 。 
每 次 在 键盘 上 敲 键 ， 都 将 产生 惟一 的 ASCII 码 。 比 如 键盘 上 的 数字 3， 它 的 ASCII 码 是 
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00110011， 数 字 2 的 ASCII 码 是 00110010， 小 写 e 是 01100101， 回 车 符 是 00001101。 可 参考 附录 EE， 
在 图 E-3 中 列 出 了 完整 的 ASCII 码 表 。 当 用 户 在 键盘 上 按 下 一 个 键 时 ,键盘 传 输 给 计算 机 的 是 其 
ASCII 码 值 。 至 于 传输 这 个 ASCII 码 所 涉及 的 存储 地 址 和 读 和 人 机制， 将 在 第 8 章 予 以 介绍 。 
键盘 上 的 大 多 数 按键 ， 都 对 应 不 止 一 个 ASCII 码 ， 如 大 写 E 的 ASCII 码 是 01000101， 而 小 写 e 则 
是 01100101， 但 这 两 个 字母 在 键盘 上 却 是 同一 个 按键 。 键 盘 通 过 功能 键 Shift 是 否 同时 按 下 来 ， 区 
别 两 种 情况 。 如 果 Shift 键 同时 按 下 ， 则 该 键 表 示 大 写 E， 否 则 代表 小 写 e。 
另外 ， 在 显示 器 上 输出 的 字符 ， 也 是 由 计算 机 通过 ASCII 编 码 方式 传输 给 显示 器 的 。 该 操作 机 


制 也 将 在 第 8 章 中 介绍 。 
2.7.4 十 六 进 制 计数 法 


我 们 已 介绍 过 ， 信 息 可 以 表示 为 二 进 制 补 码 、 位 矢量 、 浮 点 数 、ASCII 码 等 方式 。 当 然 ， 还 存 
在 其 他 表达 方式 ， 我 们 将 它们 留 给 别 的 教材 来 介绍 (本 书 将 不 再 深入 )。 但 是 ， 在 本 书 中 ， 还 将 介 
绍 一 种 数据 类 型 ， 它 不 仅 适合 计算 机 操作 ， 更 重要 的 是 ， 它 是 一 种 方便 人 们 阅读 的 表达 方式 ， 这 
就 是 十 六 进 制 计数 法 。 它 起 源 于 二 进 制 表示 法 ， 但 更 方便 表示 长 串 的 二 进 制 数 。 
在 LC-3 中 ， 我 们 将 使 用 它 来 表示 单位 长 度 为 16 位 的 二 进 制 数 。 
假设 有 这 样 一 个 16-bit 二 进 制 数 据 : 
0011110101101110 
我 们 做 个 试验 ， 先 浏览 一 遍 ， 然 后 用 手 将 这 些 数 字 遮 住 。 试 问 ， 你 能 将 这 些 数 字 默 写 出 来 
么 ? 而 我 们 如 果 采 用 十 六 进 制 数 来 表示 ， 则 容易 得 多 。 
一 个 16 位 二 进 制 数 可 以 表示 为 如 下 形式 : 
d,50,4,30,50,16 9090505065050 403050409 
其 中 任意 4; 的 取 值 为 0 或 1。 
如 果 将 该 16-bit 二 进 制 数 看 做 无 符号 整数 ， 则 可 通过 下 面 的 公式 计算 它 的 值 . 
d, X 2P + aX 2^ ca4 x2? + ax 22 a x 2! + ag x 2 + a, x 2’ + a, x 2 
*ta,X2 + aç x26 +a; x2 + a,x 2+ ax? «a, x2 «a x2 + ayx 2 
如 果 将 此 式 简化 为 : 前 4 项 提取 公 因 子 2”， 第 5~8 项 提取 公 因 子 2*， 第 9~12 项 提取 公 因 子 24， 
最 后 4 项 结合 ， 提 取 公 因子 2 ME: 
2"[a x 2 ca x2 +a x2 + a x 27] 
+2°[a x 2 + ax 2 + ag X 2' + as x 27] 
+24[ay x 22 + a, x 2 + a,x 21 + a,x 22] 
420 [a x 22 + a, x 2 c a, x 22 + ay x 27] 
注意 ， 每 个 方 括号 内 的 最 大 值 都 是 15。 如 果 我 们 用 一 个 符号 来 代表 方 括号 内 的 值 (从 0 到 15)， 
并 将 2 替换 为 16 ，28 蔡 换 为 165，24 蔡 换 为 16:，20 替 换 为 16"， 则 得 ; 
h,x 168 + h, x 16^ +h, x 16 hy x 16? 
ARREARS ARE, nte A fU[as x 2 + agx sas x2 cap x 22], 
由 于 任意 h 的 取 值 范围 是 0~15， 所 以 我 们 用 符号 0、1、2、3、4、5、6、 7 8. 9$, A, B, C, 


D、E、F 和 锋 16 个 字符 来 代表 符号 有 的 16 个 可 能 取 值 。 即 0 代表 0000、1 代 表 、…… 、9 代 表 1001、A 
代表 1010、…… 、E 代 表 1111， 我 们 称 这 种 表示 法 为 十 六 进 制 数 (hexadecimal), 或 基 (base) 为 


16 的 表示 方法 。 
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试问 ， 如 果 十 六 进 制 数 E92F 代 表 的 是 一 个 16-bit 二 进 制 数 ， 那 么 该 数 是 正 数 还 是 负数 ? 为 什么 ? 
现在 反问 一 下 ， 十 六 进 制 数 表示 法 有 什么 好 处 昵 ? 看 起 来 它 仅仅 在 表示 方法 上 做 了 些 变化 ， 
并 未 带 来 什么 好 处 啊 ? 让 我 们 回 到 刚才 的 那个 上 默写 试验 。 如 果 将 二 进 制 数 
0011110101101110 
改写 为 十 六 进 制 ， 即 将 它 分 成 4 段 
0011 1101 0110 1110 
每 段 (4 个 bit) 对 应 的 十 六 进 制 数 是 
3 D 6 E 
我 们 会 发 现 ， 很 容易 记 住 3D6E。 
所 以 ， 十 六 进 制 计数 法 (用 来 替代 二 进 制 数字 串 ) 的 主要 好 处 是 方便 记忆 和 使 用 。 通 过 它 ， 
我 们 可 以 表示 二 进 制 数 、 浮 点 数 、ASCII 字 符 序列 或 位 矢量 等 各 种 数据 类 型 。 同 时 ， 这 种 记忆 上 的 
简易 性 ， 避 免 了 因 二 进 制 数字 串 过 长 而 引起 的 卷 写 错误 。 


2.8 习题 


2.1 一 个 n-bit 数 可 以 表示 多 少 个 不 同 的 二 进 制 数 ? 

2.0 如果 采 用 二 进 制 bit 串 来 表示 英语 中 的 26 个 字母 ， 至 少 需要 多 少 个 bit? 如 果 还 要 区 分 大 小 写字 
H, XEREZ bit? 

2.3 a. 假 设 某 班级 有 400 个 学 生 ， 如 果 我 们 为 每 个 学 生 分 配 一 个 惟一 的 二 进 制 bit 串 ， 那 么 至 少 需 
要 多 少 个 bit 来 表示 所 有 的 学 生 ? 
b. 如 果 不 再 增加 bit 数 ， 这 个 班 最 多 还 能 增加 多 少 个 学 生 ? 

2.4 ”给 定 n 位 (bit)， 它 可 以 表示 多 少 个 不 同 的 无 符号 整数 ”范围 是 多 大 ? 

2.5 如果 用 5-bit 二 进 制 串 表示 数值 ， 写 出 数值 7 和 -7 分 别 对 应 的 反 码 、 符 号 位 码 和 补 码 表示 方式 。 

2.6 ”试用 6-bit 反 码 表示 数值 -32。 

27 试 列 出 4-bit 一 进 制 补 码 所 能 表示 的 所 有 整数 。 

2.8 a.8-bit 二 进 制 补 码 能 表示 的 最 大 正 整数 是 多 少 ? 分 别 写 出 十 进 制 和 二 进 制 数 。 
b. 8-bit 二 进 制 补 码 能 表示 的 具有 最 大 绝对 值 的 负数 是 多 少 ? 分 别 写 出 十 进 制 和 二 进 制 数 。 
c.n-bit 二 进 制 补 码 所 能 表示 的 最 大 正 整数 是 多 少 ? 
d. n-bit 二 进 制 补 码 所 能 表示 的 具有 最 大 绝对 值 的 负数 是 多 少 ? 

2.9 ”如 果 用 二 进 制 补 码 方式 表示 摩尔 常数 6.0 x 10”， 需 要 多 少 个 bit? 

2.10 将 下 面 的 二 进 制 补 码 转换 为 十 进 制 数 : 


a. 1010 b. 01011010 

c. 11111110 d. 0011100111010011 
2.443. 将 下 面 的 十 进 制 数 转换 为 8-bit 二 进 制 补 码 : 

a. 102 b. 64 c. 33 

d. —128 e. 127 


242 二 进 制 补 码 最 后 一 位 如 果 是 0， 那 么 这 个 数 必然 是 偶数 。 如 果 二 进 制 补 码 的 最 后 两 位 都 为 0 
(例如 二 进 制 数 01100) ， 那 么 这 种 数 有 什么 特点 ? 

2.13 请 将 下 面 的 二 进 制 数 改写 为 8-bit 数 ， 且 不 允许 改变 其 原 有 数值 。 
a. 1010 b. 011001 
c. 1111111000 d. 01 
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2.14 


2.15 


2.18 


2.2] 
2.22 
2.23 
2.24 
2.25 
2.26 


2.27 


2.28 
2.29 


2.30 


2.31 


#2 Ë 





计算 下 列 二 进 制 加 法 ， 结 果 仍然 表示 为 二 进 制 数 。 


a. 1011 + 0001 b. 0000 + 1010 c. 1100 + 0011 
d.0101 + 0110 e. 1111 + 0001 

在 本 章 例 2-5 中 , 证 明了 一 个 二 进 制 数 左 移 I 位 等 价 于 将 该 数值 乘 2。 试 问 ， 如 果 将 其 右 移 1 位 ， 
等 价 于 什么 操作 呢 ? 


计算 以 下 8-bit 加 法 的 结果 ， 并 分 别 写 出 结果 所 对 应 的 二 进 制 和 十 进 制 数 。 
a. 7 的 反 码 加 上 -7 的 反 码 ， b. 7 的 符号 位 表示 加 上 一 7 的 符号 位 表示 ， 

c. 7 的 补 码 加 上 一 7 的 补 码 。 

计算 以 下 二 进 制 补 码 加 法 ， 并 将 结果 转换 为 十 进 制 形式 。 


a.01+1011 b. 11 + 01010101 
c. 0101 + 110 d. 01 +10 

计算 以 下 无 符号 二 进 制 数 的 加 法 ， 并 将 结果 转换 为 十 进 制 形 式 。 
a. 01 +1011 b. 11 + 01010101 

c. 0101 + 110 d.01 +10 


将 十 进 制 数 -27 分 别 转换 为 8-bit 补 码 、16-bit 补 码 和 32-bit 补 码 ， 并 阐述 符号 扩展 在 这 三 种 表 
达 形 式 中 的 应 用 。 
在 以 下 4-bit 补 码 运算 中 ， 其 中 哪些 计算 会 产生 溢出 ? 请 将 操作 数 和 计算 结果 分 别 改写 为 十 进 


制 方式 子 以 验证 。 
a. 1100 + 0011 b. 1100 + 0100 c.0111 + 0001 
d. 1000 - 0001 e. 0111 + 1001 


试 描述 在 什么 情况 下 ， 两 个 补 码 相 加 将 产生 洲 出 。 

试 给 出 两 个 16-bit 补 码 相 加 产生 溢出 的 例子 。 

试 描述 在 什么 情况 下 ， 两 个 无 符号 整数 相 加 会 产生 溢出 。 

试 给 出 两 个 16-bit 无 符号 数 相 加 产生 溢出 的 例子 。 

试 解释 ， 为 什么 在 补 码 方式 下 负数 和 正 数 相 加 不 会 产生 谥 出 ? 

将 数值 -64 表 示 为 二 进 制 补 码 方式 ， 并 回答 以 下 问题 : 

a. 最 少 需 要 多 少 bit? 

b. 这 些 bit 能 够 表示 的 最 大 正 整数 是 多 少 (分 别 给 出 二 进 制 和 十 进 制 数 ) ? 

c. 这 些 bit 能 够 表示 的 最 大 无 符号 整数 是 多 少 (分 别 给 出 二 进 制 和 十 进 制 数 ) ? 

LC-3 是 一 个 16-bit 计 算 机 ， 如 果 LC-3 对 补 码 0101010101010101 和 0011100111001111 相 加 的 结 
果 为 1000111100100100， 请 问 读 结果 有 问题 吗 ? 如 果 有 ， 问 题 是 什么 ? 如 果 设 有 ， 为 什么 ? 
试 阐 述 逻辑 AND 运 算 在 什么 条 件 下 输出 为 1。 

填写 下 面 逻 辑 AND 运 算 的 真 值 表 。 





求解 下 列 逻 辑 运算 结果 ， 给 出 二 进 制 表示 。 


a. O1010111 AND 11010111 b. 101 AND 110 
c. 11100000 AND 10110100 d. 00011111 AND 10110100 
e. (0011 AND 0110) AND 1101 f. 0011 AND (0110 AND 1101) 


WARIRGE £EORGS SE£E (T ZAR PIRE HOST. 


bit, BdERSIAGUER 0000000000000 3E 


2.32 填写 下 面 的 逻辑 OR 运 算 的 真 值 表 。 





2.33 求解 下 列 罗 辑 运 算 结 果 : 


a. 01010111 OR 11010111 b. 101 OR 110 
c. 11100000 OR 10110100 d. 00011111 OR 10110100 
e. (0101 OR 1100) OR 1101 f. 0101 OR (1100 OR 1101) 

2.34 求解 下 列 逻 辑 运 算 结 果 : 
a. NOT(1011) OR NOT(1100) b. NOT(1000 AND (1100 OR 0101) 
c. NOT(NOT(1101)) d. (0110 OR 0000) AND 1111 


2.35 RER, fEAKXEDUIZ-1Irh, REFEREA? 
2.36 参考 本 章 例 2-11， 回 答 以 下 问题 : 
a. 如 果 要 标识 2 号 机 器 为 “忙碌 ”， 屏 项 字 应 该 是 多 少 ? 执行 什 么 逻辑 操作 ? 
b. 如 果 要 同时 标识 2、6 号 两 台 机 器 为 “空间 ”， 屏 项 字 应 该 是 多 少 ? 执行 什么 逻辑 操作 ( 提 
zm: 只 要 一 次 操作 即 可 ) ? 
c. 如 果 要 标识 所 有 机 器 都 处 于 “人 忙碌” 状态， 屏蔽 字 是 多 少 ? 执行 什么 操作 ? 
d. 如 果 要 表示 所 有 机 器 都 处 于 “空闲 ”状态 ， 屏 蔽 字 是 多 少 ? 执行 什么 操作 ? 
e. 编写 一 个 程序 ， 专 门 操作 第 2 位 。 如 果 第 2 位 为 0， 则 程序 输出 00000000， 如 果 第 2 位 为 1， 
则 程序 输出 1000000。 换 名 话说 ， 它 等 价 干 这样 一 种 情况 ， 假 设 BUSYNESS 的 值 为 


C| e s | u e| o 


那么 程序 输出 则 为 


Coolololo To 


(提示 ， 一 个 二 进 制 数 和 本 身 相 加 会 产生 什么 情况 ?) 

2.37 假设 +、m、s 都 是 4-bit 补 码 数 ， 且 s 是 x 和 mm 相 加 的 结果 。 如 果 只 允许 使 用 2.6 节 中 介绍 的 逻辑 
运算 ， 如何 判 断 x 和 mm 相 加 的 结果 是 否 溢出 ?编写 一 个 程序 ， 输 入 n、mm 和 s 的 值 ， 如 果 n 和 m 
相 加 溢出 ， 则 输出 1000， 如 果 设 有 溢出 ， 则 输出 0000。 

2.38 ”如 果 n、m、s 都 是 4-bit 无 符号 整数 ，s 是 nn 与 m 相 加 的 结果 。 如 果 只 允许 使 用 2.6 节 中 介绍 的 逻 
辑 运算 ， 如 何 判 断 a 和 m 相 加 的 结果 是 否 溢出 ”编写 一 个 程序 ， 输 入 x、m 和 :的 值 ， 如 果 n 和 
m 相 加 溢出 ， 则 输出 1000， 如 果 没 有 溢出 ， 则 输出 0000。 

2.39 ”将 以 下 十 进 制 数 转换 成 IEEE 浮 点 数 方式 。 

a. 3.75 b.—55 c 
c. 3.1415927 d. 64 000 

2.40 HELA P IEEE?? RRR R A T HET 
a. 0 10000000 00000000000000000000000 
b. 1 10000011 00010000000000000000000 
c.0 11111111 00000000000000000000000 
d. 1 10000000 10010000000000000000000. 

2.4 a. 32-bit IEEE 浮 点 数 能 表示 的 最 大 数值 是 多 少 ? 
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2.42 


2.43 


2.44 


2.45 


2.46 


2.47 


2.48 


2.49 


2.50 


2.51 


2.52 


£2* 


b. 32-bit IEEE 浮 点 数 能 表示 的 最 小 数值 是 多 少 ? 

一 个 程序 员 编 写 了 一 个 两 数 求 和 的 程序 。 但 是 运行 后 发 现 ，5 和 8 相 加 的 结果 是 字符 “m”， 
请 分 析 造 成 这 种 奇怪 现象 的 可 能 原因 。 

将 以 下 十 六 进 制 ASCH 码 改写 为 8-bit 二 进 制 ASCII 码 。 

a. x48656c6c6f21 b. x68454c4c4f21 

c. x43616d70757465727321 d. x4c432d32 

如 果 要 将 数字 3 的 二 进 制 表示 转换 成 字符 “3” 的 ASCII 码 ， 请 问 如 何 操作 ? 那么 ， 数 字 4 到 
字符 “4” 的 转换 呢 ? 试问 ， 是 否 任意 数字 都 可 以 通过 这 种 操作 来 转换 ? 

将 以 下 无 符号 数 从 二 进 制 方式 转换 为 十 六 进 制 方式 。 


a. 1101 0001 1010 1111 b. 001 1111 

c.1 d. 1110 1101 1011 0010 
将 以 下 十 六 进 制 数 转换 为 二 进 制 形式 。 

a. x10 b. x801 

c. xF731 d. x0OF1E2D 
e. xBCAD 

将 以 下 十 六 进 制 补 码 转换 为 十 进 制 数 。 

a. xFO b. x7FF 
c. x16 d. x8000 
将 以 下 十 进 制 数 转换 为 二 进 制 补 码 及 其 十 六 进 制 表示 。 

a. 256 b. 111 

c. 123 456 789 d. —44 


下 面 是 十 六 进 制 表示 的 补 码 之 间 的 运算 。 请 问 ， 能 否 不 将 它们 展开 为 二 进 制 方式 ， 而 直接 计 

算 各 式 的 值 ， 结 果 仍 然 采用 十 六 进 制 表示 。 

a. X025B + x26DE b. x7D96 + xF0A0 

c. XA397 + xA35D d. x7D96 + x7412 

e. 对 c 和 d 的 计算 结果 有 什么 补充 吗 ? 

下 面 是 十 六 进 制 补 码 的 逻辑 和 运算。 请 问 ， 能 否 不 将 它们 展开 为 二 进 制 方式 ， 而 直接 计算 各 式 

的 值 ， 结 果 仍 然 采用 十 六 进 制 表示 。 

a. X5478 AND Xfdea b. xABCD AND x1234 

c. NOT(NOT(xDEFA)) AND (NOT(xFFFF)) d. x00FF XOR x325C 

试 写 出 以 下 数值 的 十 六 进 制 形 式 。 

a. 25 675 b. 675.625, IEEE 754 浮 点 数 标准 形式 

c. ASCII 字 符 串 ，Hello 

假设 十 六 进 制 数 为 x434F4D50 和 x55544552。 请 填写 下 表 ， 将 这 两 个 数 用 不 同 的 方式 表示 。 
x434F4D50 x55544552 





无 符号 二 进 制 整数 形式 
二 进 制 反 码 形式 

二 进 制 补 码 形式 

IEEE 754 浮 点 数 形式 
ASCII FF 





bit, SIE TA REX 


2.533 ”填写 以 下 算式 的 真 值 表 ， 并 用 OR 和 NOT 逻 辑 表示 C,。 
Q, = NOT(A AND B) 
Q, = NOT(NOT(A) AND NOT(8)) 
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A B Q, Q: 


0 0 1 0 


2.54 填写 下 面 式 子 的 真 值 表 。 


2.55 


2.56 


Q, = NOT(NOT(X) OR (X AND Y AND Z)) 
Q: = NOT((Y OR Z) AND (X AND Y AND Z)) 


X Y Z Q, Q; 


0 0 0 0 1 


我 们 已 学 过 二 进 制 (base-2) 和 十 六 进 制 (base-16) 的 数字 表示 方法 。 如 果 是 无 符号 base-4 
方式 ， 我 们 称 之 为 四 进 制 (quad)。 在 四 进 制 中 ， 每 个 数字 的 表示 可 以 是 0、1、2 或 3。 试 问 : 
a. 3 位 四 进 制 数 能 表达 的 最 大 无 符号 数值 是 多 少 〈 请 用 十 进 制 回答 ) ? 

b. ?位 四 进 制 数 能 表达 的 最 大 无 符号 数值 是 多 少 (提示 : 答案 必须 以 n 为 参数 ) ? 

c. 计算 无 符号 四 进 制 数 023 和 221 相 加 的 结果 。 

d. 求 出 十 进 制 数 42 的 四 进 制 表示 。 

e. 求 出 将 四 进 制 数 123.3 转 换 为 二 进 制 方式 的 表示 。 

f 将 四 进 制 数 123.3 转 换 为 IEEE 浮 点 数 表示 。 

g. 假设 一 个 黑箱 函数 ， 该 黑箱 的 输入 是 一 个 m 位 四 进 制 数 ， 输 出 是 一 位 四 进 制 数字 。 试 问 
该 黑箱 函数 有 多 少 种 可 能 的 实现 (提示 : 排列 组 合 ， 对 于 任意 一 个 特定 输入 ， 有 4 种 可 能 
输出 ) ? 

试 定义 一 种 新 的 8-bit 浮 点 数 格式 ， 符 号 位 1-bit、 指 数字 段 4-bit (校正 值 为 ?7， 即 bias=7)、 尾 

数 3-bit。 试 问 ， 十 六 进 制 数 xE5 转 换 为 该 8-bit 浮 点 数 的 结果 是 什么 ? 最 后 数值 (十进制 ) 是 

多 少 ? 


第 3 章 数字 逻辑 


在 第 1 章 中 ， 我 们 曾 提 到 计算 机 是 由 非常 多 的 简单 逻辑 单元 组 合 而 成 的 。 如 Intel 公 司 2000 年 推 
出 的 奔腾 IV 处 理 器 ， 就 包含 了 4200 万 个 MOS 唱 体 管 。 同 样 ，IBM 公 司 2002 年 推出 的 PowerPC 750 
FX 包含 了 3800 多 万 个 MOS 晶 体 管 。 在 本 章 里 ， 我 们 将 介绍 逻辑 单元 的 基本 要 素 一 -MOS 晶体 管 的 
工作 原理 ， 以 及 如 何 基 于 MOS 蝇 体 管 实现 逻辑 门 (Logic Gate) ， 然 后 是 如 何 通过 逻辑 门 互 连 构建 
计算 机 的 组 成 单元 。 我 们 将 在 第 4 章 介 绍 计算 机 及 其 组 成 单元 ， 如 控制 器 、ALU、 内 存 等 。 

下 面 开始 第 一 个 话题 ， 晶 体 管 。 


3.1 MOS 唱 体 管 


如 今 大 多 数 的 计算 机 ， 至 少 是 大 多 数 的 微 处 理 器 ， 都 是 由 MOS 晶 体 管 构建 而 成 的 。“MOS” 
代表 金属 总 化 物 半 导体 (metal-oxide semiconductor) ， 有 关 MOS 的 电气 特性 ， 不 在 本 书 讲述 范围 。 
它 在 计算 机 抽象 层 次 的 最 底层 还 要 靠 下 ， 属 于 电子 学 课程 知识 。 换 甸 话 说 ， 如 果 任 何 原因 导致 
MOS 唱 体 管 异 常 ， 我 们 是 束手无策 的 。 但 是 ， 通 常情 况 下 MOS 晶 体 管 的 工作 是 非常 稳定 的 ， 不 太 
可 能 出 现 癌 题 。 尽 管 如 此 ， 我 们 还 是 有 必要 了 解 p 型 和 n 型 等 两 类 MOS 晶 体 管 的 基本 工作 原理 。 它 
们 的 工作 原理 和 电灯 开关 非常 相似 。 

图 3-1 是 一 个 简单 的 电路 ， 其 中 包括 ， 电源 (本 例 中 的 120V 是 房屋 电力 系统 )、 开 关 ORE) 
和 电灯 (通过 插座 接 电 )。 如 果 和 希望 电灯 发 热 发 亮 ， 电子 就 必须 流动 ， 为 了 让 电子 流动 ， 必 须 在 电 
源 、 电 灯 之 间 构 成 回路 ， 即 让 电子 从 电源 出 发 ， 流 过 电灯 并 返回 电源 。 通 过 图 中 开关 的 闭合 或 断 
开 ， 可 以 实现 该 回路 的 流动 或 断 开 ， 从 而 实现 电灯 亮 或 灭 的 控制 。 


墙 上 开关 





图 3-1 电灯 开关 电路 


然而 ， 我 们 也 可 以 通过 一 个 n 型 或 p 型 MOS 晶 体 管 代 替 图 3-1 中 的 开关 ， 从 而 控制 回路 的 通 断 。 
如 图 3-2 所 示 ， 其 中 图 3-2a 表 示 的 是 一 个 n-MOS 管 结构 ， 图 3-2b 是 n-MOS 管 控制 电路 通 断 的 示意 图 。 
如 图 3-2a 所 示 ， 我 们 看 到 该 晶体 管 共有 三 个 引 脚 (或 “电极 ")， 它 们 分 别 被 称 做 “ 栅 极 ”(gate)、 
"GA" (source) 和 “ 漏 极 ”(drain) 。 在 本 课程 中 ， 我 们 无 需 关 心 这 些 名 称 的 来 源 ， 只 需要 知道 
MOS 品 体 管 的 一 个 重要 特性 对 于 n-MOS 上 晶体管 ， 如 果 在 栅 极 接 入 2.9V 电 压 ， 则 在 源 极 和 漏 极 之 
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间 就 会 产生 一 条 通路 ， 这 时 候 n-MOS 癌 体 管 就 等 于 是 一 根 连通 线 ， 专 业 术 语 上 称 “ 导 通 ” 或 “ 财 
路 ”"。 如 果 栅 极 电压 是 0V， 则 源 极 和 沁 极 之 间断 开 ， 我们 称 源 极 和 漏 极 之 间 “ 断 开 ” 或 “开路 ” 


(open circuit) , 





图 3-2 n 型 MOS 管 


图 3-2b 是 一 个 由 n-MOS 管 、 电 宰 和 小 灯泡 组 成 的 简单 电路 。 如 果 在 n-MOS 管 的 栅 极 加 上 2.9V 
电压 ， 则 MOS 管 导 通 ， 从 而 在 电 字 和 灯 钨 之 间 构 成 了 闲 路 ， 将 灯泡 点 亮 。 如 果 栅 极 电 压 是 OV， 则 
MOS 晶 体 管 开 路 ， 闭 合 回路 断 开 ， 灯 袍 熄灭 。 

图 3-2c 是 图 3-2b 的 简化 示意 图 。 在 这 种 图 中 ， 工程 师 们 通常 只 将 电源 的 正 、 负极 (地) 在 器 件 
附近 标注 出 来 (而 不 是 让 电源 线 画 满 整个 电路 图 )。 标 识 方法 是 : 横 线 代表 正极 、 下 三 角 代 表 接 地 。 
事实 上 ， 电 源 模块 及 其 在 整个 电路 中 的 连接 关系 非常 简单 ， 易 于 理解 ， 所 以 S 
电路 原理 图 中 通常 不 子 标识 出 来 。 

P 型 MOS 管 和 n 型 MOS 管 的 工作 机 制 完 全 相反 (或 称 为 互补 )。 图 3-3 是 p- 

MOS 管 的 示意 图 ， 当 p-MOS 管 的 栅 极 电压 为 OV 时 ， 源 极 和 漏 极 之 间 相 当 于 一 od 

根 导 线 ， 即 线路 导 通 ， 而 当 栅 极 电 压 为 2.9V 时 ， 则 p-MOS 管 开路 。 由 于 p- 
MOS 管 和 n-MOS 管 的 工作 方式 正好 相反 ， 因 此 电路 中 如 果 同 时 包含 p-MOS 和 
n-MOS 上 晶体 管 ， 则 称 该 电路 为 “CMOS 电 路 ”， 即 互补 金属 氧化 物 半 导体 
(Complementary Metal-Oxide Semiconductor CMOS ) 。 


3.2 逻辑 门 
在 第 2 章 中 ,我 们 已 介绍 了 AND、OR、NOT 等 逻辑 函数 及 其 真 值 表 ， 本 节 将 介绍 如 何 使 用 
CMOS 电 路 来 实现 它们 。 在 电子 工程 中 ， 通 常 将 实现 逻辑 函数 的 CMOS 电 路 称 为 “逻辑 门 电路 ” 


(Logic Gate Circuit)， 如 AND、OR、NOT 等 逻辑 所 对 应 的 CMOS 电 路 ， 分 别 被 称 为 “与 门 ” 
(AND Gate)、“ 或 门 ”(OR Gate) 和 “ 非 门 ”(NOT Gate), 


D 
图 3-3 p 型 MOS 管 


3.2.4 非 门 


图 3-4 所 示 是 计算 机 中 最 简单 的 一 种 逻辑 结构 ， 它 由 两 个 晶体 管 组 成 ， 一 个 p-MOS 管 、 一 个 n- 
MOS 管 。 图 3-4a 是 该 结构 的 原理 图 ， 图 3-4b 则 表示 该 电路 在 输入 为 OV 时 的 工作 状态 。 注 意 ， 其 中 
p-MOS 晶 体 管 处 于 导 通 状态 ， 而 n-MOS 管 处 于 截止 状态 。 因 此 ， 输 出 与 2.9V 电 源 连通 。 与 此 相反 ， 
如 果 输 入 电压 为 2.9V， 则 p-MOS 管 不 导 通 而 n-MOS 管 导 通 ， TH HR 地 按 通 电路 的 完整 
特性 可 以 通过 一 张 表 来 表示 ， 如 图 3-4c 所 示 。 符 号 “0” 代 表 0V 电 压 ， 符 号 “1” 代 表 2.9V 电 压 ， 

结果 这 张 表 与 我 们 在 第 2 章 中 学 过 的 NOT 函 数 真 值 表 完全 相同 。 
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2.9V 


In Out Inz 0 Out = 1 





a) b) 
In Out In | Out 
ov 2.9V 0 1 
2.9V oy 1 0 
c) d) 


图 3-4 CMOS 反 相 器 l 
换 句 话说， 我 们 所 介绍 的 这 个 电路 是 NOT 逻 辑 (第 2 章 ) 的 具体 实现 ， 通 常 该 电路 被 称 为 “ 非 
T R “AMME”, 
3.2.2 或 门 、 或 非 门 


图 3-5 所 示 是 或 非 门 。 图 3-5a 是 实现 或 非 门 的 逻辑 电路 ， 它 由 2 个 p-MOS 晶 体 管 和 2 个 n-MOS 管 
组 成 。 








图 3-5 或 非 门 
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图 3-5b 表 示 在 4 端 输 入 0V、B 端 输入 2.9V 电 压 时 的 电路 工作 状态 。 在 这 种 情况 下 ， 上 面 的 p- 
MOS 管 导 通 ， 下 面 的 p-MOS 蝙 体 管 截止 ， 输 出 端 C 与 2.9V 电 源 断 开 。 然 而 ， 由 于 最 左边 的 n-MOS 
管 导 通 ， 所 以 C 与 OV (地) 接 通 。 

如 果 4 和 8 端 输入 都 为 0V， 则 2 个 p-MOS 管 同时 导 通 ， 因 而 输出 C 接 通 2.9V 电 压 。 注 意 ， 此 时 不 
存在 二 义 性 (或 不 确定 性 )， 因 为 底下 的 2 个 n-MOS 管 都 是 断 开 的 ， 所 以 C 与 OV 电压 之 间 不 存在 连接 。 

如 果 4 和 8 端 输 入 都 是 2.9V， 则 对 应 的 2 个 p-MOS 管 都 处 于 开路 ， 输 出 端 C 与 2.9V 电 压 完 全 断 开 。 
而 输入 的 2.9V 电 压 将 底下 的 2 个 n-MOS 管 打通 了 ， 因 而 C 端 接地 (0V), 

图 3-5c 总 结 了 图 3-5a 所 示 电 路 的 可 能 状态 。 列 出 了 输入 4 和 8 的 4 种 不 同 电压 组 合 : 

A=0V, B=0V 

A=0V, B=2.9y 
A=2.9V, B=0V 
A=2.9V, B=2.9V 

如 果 将 电压 值 替 换 为 等 价 的 逻辑 值 ， 则 对 应 如 图 3-5d 所 示 的 真 值 表 。 我 们 发 现 其 中 C 的 输入 与 
OR 逻 辑 完全 相反 。 所 以 ， 我 们 称 之 为 “或 非 ” 函 数 ， 简 称 NOR。 实 现 NOR 逻 辑 的 电路 被 称 为 “或 
非 门 ”。 

如 果 在 图 3-5a 所 示 电 路 的 后 面 加 一 级 反 相 器 ， 如 图 3-6a 所 示 ， 则 端口 D 的 输出 就 是 OR 逻辑 。 图 
3-6b 是 4 输入 为 0、B 输 入 为 1 时 的 电路 工作 状态 。 图 3-6c 是 该 电路 对 应 的 真 值 表 。 


a) 





图 3-6 或 门 


3.23 与 门 、 与 非 门 

图 3-7 是 与 门 电路 。 其 中 4 或 8 任 一 端 输入 为 0V，C 与 2.9V 电 源 直接 连通 。 而 C 为 高 电 平 ， 则 意 
味 着 它 控制 的 n-MOS 管 导 通 并 将 D 接 地 。 总 之 ， 在 图 3-7 所 示 的 电路 中 ， 如 果 A 或 B 中 任 一 端 输入 为 
0V， 则 导致 D 端 输出 为 0V。 l 
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同样 ， 我 们 发 现 该 电路 中 也 不 存在 二 义 人 性 。 对 此 我 们 做 一 个 分 析 : 如 果 4 和 8 中 有 任 一 端 输入 
为 0， 则 4 和 8 控制 的 2 个 a-MOS 管 中 ， 至 少 有 一 个 是 开路 的 〈 断 开 )， 结 果 是 C 与 地 之 间 至少 是 断 开 
的 。C 输 出 为 2.9V， 意 味 着 它 所 控制 的 p-MOS 管 是 开路 的 。 所 以 ，D 与 2.9V 之 则 是 不 相通 的 。 

如 果 4 和 8 的 输入 都 是 2.9V， 由 4、B 控 制 的 2 个 p-MOS 管 都 是 开路 的 ，2 个 n-MOS 管 都 导 通 ， 因 
而 C 接 地 。 由 于 C 接 地 ， 则 最 右边 的 p-MOS 为 闭路 ， 强 制 D 为 2.9V。 





图 3-7 与 门 


图 3-7b 是 图 3-7a 电 路 对 应 的 真 值 表 。 注 意 ,该 电路 是 一 个 “与 门 ”(AND Gate) ， 而 虚线 内 的 
电路 是 NOT-AND 门 (输出 为 C)， 简 称 “ 与 非 门 ”(NAND Gate), 

以 上 介绍 的 都 是 在 数字 逻辑 和 数字 计算 机 中 常用 的 一 些 门 电路 。 例 如 ， 奔 腾 IV 微 处 理 器 中 ， 
就 包含 了 几 百 万 个 反 相 器 (NOT Gate)。 为 方便 起 见 ， 图 3-8 给 出 了 这 些 门 电路 的 标准 符号 。 注 意 ， 
在 反 相 器 、 与 非 门 和 非 门 等 逻辑 门 的 输出 端 之 前 ， 都 有 一 个 小 圆圈 ， 它 表示 取 反 操作 ， 即 NOT。 

有 了 这 些 符号 ， 在 以 后 的 电路 图 中 ， 将 不 再 画 出 晶体 管 了 ， 而 是 采用 如 图 3-8 所 示 的 这 些 符 号 


来 代替 特定 的 逻辑 功能 。 


a) 反 相 器 b) 与 站 c) 或 站 


d) 与 非 门 e) 或 非 门 
图 3-8 基本 逻辑 门 


3.2.4 ”摩根 定律 


注意 ， 图 3-9a 所 示 输 入 信号 在 进入 逻辑 门 之 前 可 以 被 取 反 ， 如 图 中 AND 门 输入 端的 两 个 贺 点 
标识 ， 代 表 的 就 是 “ 取 反 ”操作 。 假 设 对 与 门 的 两 个 输入 4 和 8 事先 取 反 ， 同 时 对 其 输出 也 取 反 。 
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下 面 我 们 看 看 它 所 产生 的 效果 。 





图 3-9 摩根 定律 
图 3-9b 所 示 是 4 输入 为 0、B 输 入 为 1 时 的 电路 工作 情形 。 为 了 表示 清晰 ， 我 们 将 与 门 端口 与 小 
圆圈 之 间 拉 开 了 距离 ， 从 而 方便 了 对 信号 经 过 反 相 前 后 的 变化 情况 的 了 解 。 
图 3-9c 是 图 3-9a 电 路 在 各 种 输入 组 合 下 ， 其 输出 变化 的 真 值 表 。 其 中 ，4 表 示 A 的 取 反 (NOTA), 
下 面 是 该 电路 工作 情况 的 代数 表示 : 





A ANDB=AORB 


如 果 用 自然 语言 来 表示 ， 它 的 意思 是 : 

“不 存在 4 和 8 都 为 假 的 情况 ”等 价 于 “4 和 8 之 中 至 少 有 一 个 为 真 。 

这 个 等 价 转换 关系 被 称 为 摩根 定律 〔De Morgan's law)。 试 问 ， 如 果 对 一 个 与 门 的 输入 和 输出 
都 取 反 ， 该 等 价 表达 式 是 否 成 立 ? 


3.25 多 输入 门 


在 结束 逻辑 门 话题 之 前 ， 我 们 试 着 将 门 电路 的 输 
入 扩展 一 下 。 之 前 介绍 的 AND、OR、NAND 和 NOR 等 
4 种 逻辑 门 都 只 有 两 个 输入 。 我 们 也 可 以 设计 有 3 个 输 
入 的 与 门 或 4 个 输入 的 或 门 。 例 如 ， 对 于 一 个 4- 输 入 的 
与 门 ， 只 有 当 所 有 个 输入 都 为 1 的 时 候 ，n-AND 门 的 i—] Jo 
输出 才 为 1;， 如 果 其 中 任意 一 个 输入 为 0， 则 n-AND 的 C 
输出 为 0。 同 样 ， 对 于 一 个 n- 输 入 的 OR 门 ， 如 果 任 意 b) 
一 个 输入 为 1!1， 则 n-OR 门 的 输出 为 1; 而 只 有 全 部 输入 图 3-10 3 输入 与 门 
为 0，n-OR 门 输出 才 为 0。 

图 3-10 所 示 是 一 个 3 输入 与 门 。 图 3-10a 是 3 输入 与 门 的 真 值 表 ， 图 3-10b 是 3 输入 与 门 的 符号 
标识 。 

试问 ， 能 否 画 出 3 输入 与 门 的 “MOS 管 实现 电路 ”? 以 及 4 输入 与 门 、4 输 入 或 门 ? 
3.3 ”组合 逻辑 

现在 我 们 已 掌握 基本 逻辑 门 的 工作 原理 ， 下 一 步 的 任务 是 用 这 些 基 本 逻辑 门 电路 构建 逻辑 结 
构 ， 就 是 构建 计算 机 微 结 构 所 需要 使 用 的 结构 单元 。 

逻辑 结构 分 为 两 大 类 ， 一 类 是 可 以 存储 信息 的 ， 另 一 类 是 不 能 存储 信息 的 。 前 者 将 在 3.4、3.5 


和 3.6 节 中 介绍 ， 后 者 将 在 本 节 讲 述 。 这 些 结构 (不 能 存储 信息 的 ) 有 时 被 称 做 “决策 单元 ” 
(decision element), 38 E (1X SERRE. "28 6 37 8:254". (combinational logic structure) ， 这 是 因为 
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a) 
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它们 的 输出 状态 完全 取决 于 “当前 ”逻辑 结构 的 输入 。 换 句 话 说 ， 逻 辑 结 构 的 输出 状态 不 依赖 于 任 
何 历 史 信 息 (比如 记忆 在 结构 内 部 的 ) ， 因 为 这 类 逻辑 结构 根本 就 不 有 具备 “记忆 ”信息 的 能 力 。 

我 们 将 介绍 的 3 个 组 合 逻 辑 结构 是 ， 译 码 器 (decoder)、 多 路 复 用 器 (mux) 和 全 加 器 (full 
adder), 


3.3.1 译 码 器 


图 3-11 是 一 个 2 输入 译 码 器 的 逻辑 门 结构 ， 译 码 器 的 特点 是 ， 在 所 有 输出 中 有 且 仅 有 一 个 为 1， 
其 余 皆 为 0。 每 个 输出 端口 对 应 了 一 种 输入 模式 (input pattern)， 因 而 该 结构 可 以 用 于 检测 、 匹 配 
不 同 的 输入 模式 。 通 常 ， 车 译 码 器 有 nm 个 输入 ， 则 有 2" 个 输出 。 我 们 一 般 这 样 说 : 在 特定 输入 模式 
下 ， 相 应 输出 线 被 置 位 。 换 句 话 说 ， 对 于 任 一 输出 线 ， 它 仅 在 一 种 情况 下 才 为 1， 其 他 情况 下 和 皆 为 
0。 图 3-11 所 示 ， 译 码 器 的 两 个 输入 4 和 B 有 4 种 组 合 ， 而 任 一 输入 组 合 下 ， 只 对 应 一 个 输出 线 为 1。 
例如 ， 图 3-1lb 中 译 码 器 在 输入 为 “10” 时 ， 将 导致 第 3 根 输出 线 被 置 位。 


A 4=1 
B 1, 当 4、B 组 合 为 00 有 -0 0 
1, 当 4、B 组 合 为 01 0 
1, 当 4、B 组 合 为 10 1 
1, 4A, BAAI 0 

a) b) 


图 3-11 2 输入 译 码 器 


译 码 器 主要 用 于 解释 一 个 二 进 制 数 。 我 们 在 第 5 章 中 将 看 到 ， 在 LC-3 中 ， 每 条 指令 的 具体 操作 
是 由 一 个 被 称 做 “操作 码 ”(opcode) 的 二 进 制 值 决 定 的 ， 它 是 一 个 4-bit 数 值 ， 是 指令 的 一 部 分 。 
识别 每 条 指令 (或 操作 码 ) 的 4-16 译 码 器 ， 是 个 非常 简单 的 组 合 逻辑 。 
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图 3-12a 是 一 个 2 输入 多 路 复 用 器 (multiplexer, MUX) 的 门 电路 示意 图 。MUX 的 功能 就 是 从 多 
个 输入 中 选择 一 个 ， 并 将 鞭 与 输出 相连 。 选 择 信号 (图 3-12 中 的 S$) 负责 决定 究竟 选择 哪 一 个 。 
mux 的 工作 原理 如 图 3-12 所 示 ， 如 果 $ 为 0 (如 图 3-12b) ， 多 路 开关 最 右边 一 个 与 门将 输出 0， 现 在 
来 看 最 左边 那个 与 门 ， 若 4 端 输入 0， 则 右边 与 门 输出 必然 为 0 (因为 与 门 输入 中 有 一 个 为 0 则 输出 
必然 为 0)。 所 以 ， 左 边 与 门 的 输出 完全 取决 于 4 的 值 。 换 名 话说 ， 在 $ = 0 的 情况 下 ，A = 0 则 左边 
与 门 输出 也 为 0，4 = 1 则 左边 与 门 输出 也 为 1。 随 后 是 下 面 的 或 门 ， 由 于 右边 与 门 的 输出 为 0， 所 以 
它 对 或 门 的 输出 不 起 作用 。 结 果 是 ， 或 门 的 输出 C 与 与 门 的 输出 完全 相同 。 推 理 的 结果 是 ,在 S = 0 
的 情况 下 ， 输 出 C 与 输入 4 完全 相同 。 , 

相反 ， 如 果 选 择 信号 S = 1， 则 8 与 1 相 与 (AND) ， 进 而 C 与 8 完全 相同 。 

总 之 ,输出 C 的 值 或 与 输入 4 相同 、 或 与 输入 8 相同 ， 究 竞 是 选择 哪 一 个 ， 完 全 由 选择 信号 5 决 
定 。 通 常 ， 我 们 说 5 将 其 个 MUX 输 入 源 (ARB) 连 至 输出 端 。 图 3-12c 所 示 是 MUX 的 标准 标识 符号 。 
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A B A B 
S $20 
a b A 0 A B 
S 
A 
C 
C C 


a) b) c) 
图 3-12 2 选 1 多 路 复 用 器 
多 路 复 用 器 (mux) 通常 由 2 个 输入 、1 个 输出 和 个 选择 线 组 成 。 图 3-13a 是 一 个 4 选 1 多 路 复 


用 器 的 示意 图 ， 它 由 4 个 输入 和 2 个 选择 线 组 成 ， 而 图 3-13b 是 4 选 1 多 路 开关 的 标识 符 。 
试问 ， 你 能 画 出 8 选 1 多 路 复 用 器 的 示意 图 吗 ? 那么 它 需 要 多 少 个 选择 线 ? 


A B C D 
S[1 : 0] 
ABCD 
lylrlrl 
2 
S 

1 
OUT OUT 

a) b) 


图 3-13 4 选 1 多 路 复 用 器 


3.3.3 全 加 器 


在 第 2 章 中 ， 我 们 已 讨论 过 二 进 制 加 法 。 简 单 的 二 进 制 加 法 过 程 与 十 进 制 加 法 过 程 非常 相 
似 ， 从 右 向 左 ， 每 次 处 理 一 行 ， 将 当前 列 的 两 个 数字 与 之 前 进位 等 3 个 数字 相 加 ， 然 后 产生 当 
前 位 结果 和 传 至 下 一 列 运算 的 进位 。 惟 一 不 同 的 是 ， 在 二 进 制 加 法 中 满 2? 进 1 ， 而 十 进 制 加 站 中 
满 10 进 1。 

图 3-14 所 示 是 n-bit 二 进 制 数 加 法 的 真 值 表 。 真 值 表 表 示 的 是 两 个 n-bit 操 作 数 的 相 加 运算 。 每 
列 9 加 法 包含 3 个 位 相 加 ， 即 两 个 二 进 制 数位 (a 和 b;) 和 1 个 来 自前 一 列 的 进位 (carry;) 。 计 算 结 
果 有 两 个 ,一 是 当前 求 和 位 (5;) ， 二 是 将 传 至 下 一 列 运 算 的 进位 carry;,1。 例 如 ， 如 果 这 3 个 bit 中 只 
有 一 个 为 1， 则 S; = 1. carry, = 0， 如 果 3 个 bit 中 有 两 个 为 1， 则 5S; = 0, carry, = 1， 如 果 3 个 bit 全 
为 1， 则 S; = 1、carry = 1。 

O XE “At each column”， 但 此 处 “每 列 ” 的 理解 是 ， 它 不 代表 真 值 表 中 的 “ 列 ”"， 而 是 表示 两 个 二 进 制 

数 排 成 两 行 做 加 法 运算 时 ， 每“ 列 ” 包 含 两 个 操作 数 的 相同 位 置 bit 及 其 累加 结果 。 一 一 译 者 注 
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图 3-14 二 进 制 加 法 器 的 真 值 表 


图 3-15 是 加 3-14 真 值 表 的 门 电路 找 述 。 在 图 3-15 中 ， 对 应 (ai, bi carry) 的 8 种 组 合 ， 每 一 
种 情况 下 ， 都 有 且 仅 有 一 个 与 门 输出 为 1。 而 Ci 应 该 只 在 图 3-14 真 值 表 中 carryit = 1 的 那些 组 合 
T. 才 输 出 1， 这 意味 着 该 或 门 的 输入 应 该 来 自 对 应 组 合 下 的 与 门 。 与 此 类 似 ，5; 的 各 个 输入 端 
与 对 应 与 门 输出 之 闻 的 相连 ， 也 将 参考 图 3-14 的 真 值 表 ， 即 真 值 表 中 5; = 1 对 应 的 组 合 情 况 。 

注意 ， 输 入 组 合 000 的 情况 下 ， 在 真 值 表 中 既 不 影响 carry-, 也 不 影响 98;， 因 而 其 对 应 的 AND 之 
输出 不 与 Ci 和 5 中 任何 一 个 或 门 相连 。 

我 们 称 如 图 3-15 所 示 的 逻辑 电路 为 “会 加 器 ”"。 它 对 3 个 输入 (a;、bi 和 carry;) 相 加 ， 产 生 2 个 
输出 (Siflcarryui). 





图 3-15 全 加 器 的 门 电路 


图 3-16 是 一 个 4-bit 一 进 制 数 加 法 器 电路 。 包 含 4 个 全 加 器 模块 (如 图 3-15 所 示 )， 其 中 第 ;个 全 
加 器 的 进位 输出 是 第 i+1 个 全 加 器 的 输入 。 
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图 3-16 4-bit 加 法 器 的 电路 图 


3.9.4 可 编程 逻辑 阵列 


我 们 说 如 图 3-15 所 示 的 逻辑 门 单元 集合 ， 是 一 个 可 以 实现 任何 逻辑 函数 的 可 构建 模块 
(building block)。 这 种 可 构建 的 模块 又 被 称 为 可 编程 逻辑 阵列 (Programmable Logic Array, PLA), 
它 包含 一 组 与 门 ( 或 称 为 AND 阵 列 ) 以 及 一 组 或 门 (或 称 为 OR 阵列 )。 其 中 ， 与 门 的 数 自 对 应 真 
值 表 的 输入 组 合 数 目 。 如 果 逻 辑 函 数 的 输入 数目 是 x4， 则 PLA 需 要 2" 个 AND 门 。 图 3-17 中 包含 了 2 
个 3 输入 端口 的 与 门 ， 而 或 门 的 数目 则 取决 于 真 值 表 的 输出 数目 。 实 现 算 法 是 将 特定 与 门 的 输出 与 
对 应 或 门 输入 相连 ， 对 应 关系 参考 真 值 表 。 在 真 值 表 中 ， 找 出 特定 输出 变量 (对 应 一 个 或 门 ) 列 
中 值 为 1 的 那些 行 (每 行 对 应 一 个 输入 组 合 )， 所 有 这 些 输 入 组 合 对 应 的 与 门 的 输出 都 将 是 该 或 门 
的 输入 。 这 就 是 “可 编程 ”。 换 句 话说 ， 通 过 “编程 ”多 个 与 门 (不 同 的 输入 组 合 ) 与 多 个 或 门 
(不 同 的 输出 ) 之 间 的 连接 关系 ， 可 以 实现 任何 我 们 所 期 望 的 逻辑 函数 (或 功能 )。 

我 们 可 以 将 图 3-15 理 解 为 就 是 这 样 一 个 “编程 ”实现 ， 它 在 8 个 与 门 和 2 个 或 门 之 间 产 生 互 连 ， 
同时 实现 了 两 个 3 输入 函数 (sum 和 carry) 。 图 3-17 所 示 是 一 个 3 输入 4 输出 PLA。 换 句 话 说， 通过 合 
适 的 连 线 关 系 (在 与 门 和 或 门 之 间 ) ， 我 们 可 以 同时 实现 任意 4 个 不 同 的 函数 。 





图 3-17 可 编程 逻辑 阵列 


3.8.5 逻辑 完备 性 
最 后 ， 我 们 将 指出 逻辑 构建 中 的 一 个 重要 概念 一 一 还 辑 完备 性 (Logical Completeness) 。 如 
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3.3.4 小 节 所 表明 的 ， 通 过 PLA 可 以 实现 任何 形式 的 罗 辑 ， 但 PLA 却 只 包括 OR、ANPD 和 NOT 这 三 种 
逻辑 门 。 换 名 话说 ， 只 要 有 足够 的 AND、OR 和 NOT 门 ， 我 们 就 可 以 实现 任何 逻辑 函数 。 因 此 ， 我 
们 称 LAND，OR，NOT} 逻 辑 门 集合 是 “还 辑 完备 的 "。 这 意味 着 ， 不 需要 任何 其 他 门 电路 ， 通 过 
不 同 数量 的 AND、OR、NOT， 就 可 以 实现 任何 真 值 表 。 可 能 这 个 “数量 ”非常 庞大 ， 但 无 论 如 何 
是 可 实现 的 ， 这 就 是 所 谓 的 “完备 性 。 


3.4 存储 单元 


在 3.3 节 中 我 们 曾 提 到 ， 逻 辑 电路 分 为 两 大 类 : 一 类 是 可 以 存储 信息 ， 另 一 类 不 能 存储 信息 。 
前 面 给 出 的 三 个 例子 〈 译 码 器 、 多 路 开关 及 全 加 器 ) ， 都 属于 不 能 存储 信息 的 逻辑 电路 。 下 面 将 介 


绍 具 有 信息 存储 功能 的 数字 逻辑 。 
3.4.1 _R-S 锁 存 器 


最 简单 的 存储 单元 是 R-S 锁 存 器 9 (R-S latch) 。 它 能 够 存储 一 个 s 
位 的 信息 。 实 现 R-S 锁 存 器 的 方法 有 多 种 ， 最 简单 的 实现 方法 如 图 3-18 
所 示 。 它 由 两 个 NAND 门 互 连 而 成 ， 其 中 一 个 NAND 门 的 输出 是 另 一 
个 的 输入 。 

R-S 锁 存 器 的 工作 机 制 是 : 一 开始 R-S 锁 存 器 处 于 静态 (quiescent), 
即 输 入 R 和 5 都 为 1。 我 们 假设 第 一 种 情况 输出 a 为 1， 即 意味 着 输入 4 也 R 
为 1， 且 此 时 输入 R 也 为 1 (静态 ) ， 从 而 由 NAND 门 特性 得 知 ， 输 出 5 为 
0。 进 而 输入 B 为 0， 导 致 输出 z 为 1。 换 名 话说， 只 要 保持 输入 R 和 8 同 
时 为 1， 则 逻辑 电路 的 状态 就 不 会 改变 。 我 们 称 R-S 锁 存 器 这 种 能 够 保持 状态 不 变 的 特性 为 ， 具有 
“记忆 ”或 存储 能 力 。 本 例 中 R-S 保 存 的 信息 值 为 1 (输出 a 的 值 )。 

相反 ， 如 果 输 出 oa 为 0， 则 输入 4 必 为 0、 输 出 5 必 为 1。 进 而 输入 B 为 1， 结 合 输入 8 的 值 为 1 (Rh 
态 )， 得 知 输出 a 必 为 0。 同 样 ， 只 要 输入 R 和 5 保持 为 1 不 变 ， 则 电路 状态 就 不 会 改变 ， 我 们 称 此 时 
R-S 锁 存 器 保存 的 值 为 0。 

在 保持 R 为 1 不 变 的 情况 下 ， 一 旦 将 5 的 输入 改变 为 0， 则 锁 存 器 输出 立刻 改变 为 1。 同 样 ， 在 保 
持 R 为 1 的 情况 下 ， 一 旦 R 输 入 为 1， 则 锁 存 器 输出 为 0。 在 术语 中 ， 我 们 通常 称 “ 设 置 一 个 变量 为 0 
或 1” 的 操作 为 “ 置 ”(set) ， 如 “ 置 0"、“ 置 1"。 其 中 ,“ 置 0” 操 作 又 可 称 做 “清除 ”(clear) 。 

如 果 清 除 $， 将 a 变 为 1!， 进 而 A 为 1!。 而 此 时 R 仍 然 为 1， 则 5 必然 为 0， 从 而 导致 3 也 为 0， 进 而 
导致 < 必然 为 1 。 如 果 此 时 R 又 恢复 为 1， 我 们 发 现 这 并 不 会 改变 a 的 输出 ， 因 为 8 此 时 仍然 为 0( 对 于 
NAND 门 ， 只 要 其 输入 之 一 为 0 则 输出 必然 为 1)。 所 以 ， 我 们 说 即使 $ 恢 复 为 1， 锁 存 器 仍然 能 “ 记 
住 ”刚才 的 值 1。 

同样 ， 我 们 也 可 以 通过 瞬 态 地 置 R 为 0 来 清除 锁 存 器 ， 即 设置 锁 存 器 输出 为 0。 

值得 注意 的 是 ， 为 保证 R-S 锁 存 器 正常 工作 ， 不 要 同时 设置 R 和 5 为 0。 央 为 ， 如 果 S 和 R 同 时 为 
0， 则 ec 和 5 的 输出 也 将 同时 为 1。 那 么 ， 锁 存 器 状态 是 不 确定 的 ， 最 终 的 状态 将 完全 取决 于 MOS 管 
的 电气 特性 而 不 是 逻辑 操作 了 。 至 于 MOS 管 的 电气 特性 如 何 决定 最 后 状态 ， 不 是 本 书 的 内 容 ， 你 
可 能 会 在 相关 的 电子 课程 中 学 习 它 。 





图 3-18 R-S 锁 存 器 


O MX “R-S Latch” 被 翻译 为 “R-S 锁 存 器 ” (而 不 是 触发 器 ) 。 事 实 上 ， 锁 存 器 (latch)、 触 发 器 (trigger), 
寄存 器 (register) 有 相同 的 含义 和 特性 ， 它 们 之 间 没 有 本 质 区 别 。 细 微 的 差别 在 于 ，latch 强 调 的 是 它 的 工 
作 特性 ，trigger 强 调 的 是 工作 机 制 ( 如 沿 触发 或 电 平 触发 等 )， 而 register 则 是 它 在 计算 机 组 成 中 的 作用 
( 即 n-bit 锁 存 器 的 组 合 ) 。 所 以 ， 遵 循 原 文 ， 我 们 在 此 将 其 翻译 为 “R-5 锁 存 器 ”。 一 一 译 者 注 
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3.4.8 门 控 D 锁 存 器 


我 们 有 必要 对 锁 存 器 的 置 1 或 清 0 操 作 采 取 一 定 的 控制 措施 。 

图 3-19 是 门 控 D 锁 存 器 的 示意 图 。 它 由 R-S 锁 存 器 (如 图 3-18 所 示 ) 和 控制 电路 (2 个 门 电路 ) 
两 部 分 组 成 。 控 制 电路 的 作用 是 ， 当 且 仅 当 WE 有 效 时 (WE = 1)， 才 使 得 锁 存 器 的 值 (输出 ) 等 
于 D 的 输入 值 。WE 代 表 “ 可 写 ”(Write Enable)。 在 WE 无 效 时 (WE = 0)，S 和 R 的 输出 都 为 1。 由 
3.4.1 小 节 的 结论 我 们 知道 : 如 果 R 和 8 都 为 1， 则 R-S 锁 存 器 存储 的 值 保 持 不 变 。 而 当 WE 瞬 间 置 位 
( 即 WE = 1) 时 ，AND 门 输出 S 和 R 之 中 有 且 仅 有 一 个 为 0。 也 就 是 说 ， 此 时 如 果 D=1， 则 5 为 0， 如 
果 D=0， 则 左下 角 的 NAND 输 出 R 为 0。 之 前 我 们 已 知 ， 如 果 5 为 0 则 R-S 锁 存 器 为 1!1， 如 果 R 为 0 则 R-S 
锁 存 器 为 0。 所 以 ， 此 时 D 为 1 或 0 将 分 别 导 致 R-S 锁 存 器 的 输出 为 1 或 90。 而 当 WE 恢 复 为 0 时 ， 原 先 
的 D 值 将 被 永远 存储 在 R-S 锁 存 器 中 。 


D 





图 3-19 门 控 (gated) D 锁 存 器 


3.43 寄存 器 


在 第 2 章 中 我 们 看 到 ， 计 算 机 处 理 的 数据 基本 都 是 由 多 个 bit 表 示 的 。 例 如 ， 将 在 第 5 章 介绍 的 
LC-3 计 算 机 ， 在 大 多 数 情况 下 它 都 使 用 16-bit 来 表示 数据 。 因 此 ， 有 必要 将 这 些 bit 存 储 为 各 个 独立 
单元 。 寄 存 器 (register) 就 是 这 样 一 种 结构 ， 它 将 多 个 bit 组 合成 一 个 独立 单元 。 寄 存 器 的 bit 宽 度 
可 大 可 小 ， 大 到 需要 的 任意 数 ， 小 到 只 有 1 个 bit。 例 如 ， 在 LC-3 计 算 机 中 ， 如 图 3-33 所 示 ，PC、 
IR 和 MAR 等 寄存 器 的 宽度 都 是 16-bit， 而 Y、Z 和 P 等 都 是 1-bit 宽 度 的 寄存 器 。 

图 3-20 所 示 是 一 个 由 4 个 门 控 D 锁 存 器 组 成 的 4-bit 寄 存 器 。 我 们 将 该 寄存 器 存储 的 4 个 bit 分 别 标 
识 为 0;、Q,、Q1、Qo。 当 WE 有 效 时 ， 数 值 D;、D,、D1、Do 被 下 人 寄存 器 。 

注意 : Q3、Q2、Q1、0Q0o 通 常 又 被 标识 为 G[3 : 0]。 即 为 每 个 bit 标 识 一 个 数字 ， 最 右边 的 bit 是 
bit[0]， 依 次 从 右 向 左 递增 。 如 果 总 共有 n 个 bit， 则 最 左边 就 是 bit[n-1]。 以 下 面 16-bit 数 为 例 ; 

0011101100011110 


bit[15] 是 0，bit[14] 是 0，bit[13] 是 1，bit[12] 是 1， 等 等 。 
通常 我 们 还 用 Q[/:r] 表 示 一 个 bit 片 段 ，! 代 表 left、r 代 表 right。 我 们 称 这 样 的 bit 片 段 为 “字段 ” 
(field), 
例如 ，4[15:0] 是 上 面 的 16-bit 数 ， 则 
A[15 : 12] = 0011 
A[13 : 7] = 1110110 
A[2: 0] = 110 
A[1: 1] 21 
还 要 指出 的 是 ， 从 右 至 左 的 bit 编 号 顺序 完全 是 随意 的 。 我 们 完全 可 以 从 左 向 右 编号 ， 让 bit[0] 
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代表 最 左边 一 位 。 事 实 上 ， 很 多 人 也 是 这 么 做 的 。 所 以 ， 编 号 方式 是 “从 左 到 右 ” 还 是 “从 右 到 左 ” 
并 不 重要 ， 重 要 的 是 保持 一 致 ， 即 一 旦 确定 ， 必 须 始终 一 致 。 本 书 遵循 的 是 “从 右 到 左 ”的 方式 。 





图 3-20 4-bit 寄 存 器 


3.5 内 存 的 概念 


下 面 我 们 将 介绍 电子 数字 计算 机 中 最 重要 的 结构 之 一 一 一 内 在 。 到 目前 为 止 ， 描 述 内 存 所 需要 
的 工具 都 已 具备 。 随 后 ， 在 第 4 章 中 会 解释 内 存在 一 个 简要 计算 机 模型 中 的 工作 机 制 ， 贯 穿 全 书 ， 
你 必 将 体会 内 存 概念 在 计算 (computing) 过 程 中 的 重要 性 。 

内 存 是 由 一 定数 目 (通常 非常 大 ) 的 “位 置 ” 组 成 的 ， 其 中 每 个 “位 置 ” 可 以 被 单独 识别 并 
独立 存放 1 个 数据 。 通常， 我 们 称 位 置 识别 符 为 “地 址 ” ， 又 称 存 储 在 各 个 位 置 中 的 bit 数 目 为 “ 寻 
址 能 力 ”(addressability ) 。 

例如 ， 一 个 PC 机 的 广告 商 可 以 这 么 说 :“ 这 个 PC 机 有 16MB ( 兆 字 节 ，MegaBytes) 的 内 存 ”。 
这 名 话 的 意思 是 〈 稍 后 会 详细 解释 ) ， 该 计算 机 系统 中 有 16M (million) AFRE, PAMER 
容纳 1 个 字 节 的 信息 。 


3.5.4 寻 址 空间 


我 们 称 内 存 中 可 独立 识别 的 位 置 总 数 为 内 存 “ 寻 址 空间 ”(address space)。 例 如 ，16MB 内 存 
指 的 是 ， 该 内 存 包含 1 600 万 个 可 独立 识别 的 内 存 位 置 。 

事实 上 ，1 600 万 (16M) 只 是 一 个 近似 值 。 这 与 我 们 识别 内 存 位 置 的 方式 有 关 。 计 算 机 中 所 
有 的 东西 都 采用 0、1 序 列 来 表示 ， 内 存 位 置 的 标识 方法 自然 也 不 例外 。 表 示 地 址 的 bit 数 如 果 是 ， 
则 我 们 可 以 识别 2" 个 存储 位 置 。10-bit 的 地 址 可 以 标识 1024 个 位 置 ， 即 约 等 于 1000。 而 如 果 是 20-bit 
的 地 址 ， 则 有 2” 个 存储 位 置 ， 这 个 值 大 约 是 1 000 000。 那 么 ，16M 大 小 的 空间 需要 24-bit 宽 度 的 地 
址 。 但 是 ， 准 确 地 说 ，2” 地 址 空间 事实 上 包含 16 777 216 个 位 置 而 不 是 16 000 000 个 位 置 ， 但 口语 
上 ,“16 净 ”说 起 来 更 简洁 些 。 


3.5.2 JWEN 


寻 址 能 力 是 指 每 个 内 存 位 置 中 包含 的 bit 数 目 。 例 如 ， 一 个 16MB 大 小 的 内 存 ， 包 含 16 777 216 
个 内 存 位 置 ， 每 个 位 置 存储 1 个 字 节 ( 即 8-bit) 信息 。 大 多 数 内 存 都 是 字 节 寻 址 的 (byte- 
addressable), 。 这 是 个 历史 问题 ， 原 先 的 计算 机 在 数据 处 理 或 接收 键盘 输入 值 的 时 候 ， 都 会 将 其 转 
换 成 8-bit 的 ASCII 码 (参考 第 2 章 )。 如 果 内 存 是 字 节 寻 址 的 ， 那 么 每 个 ASCIH 码 刚好 占用 一 个 存储 
位 置 。 每 个 位 置 都 有 一 个 独立 的 地 址 标识 ， 无 疑 方便 了 读 写 和 修改 操作 。 
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许多 专用 于 科学 计算 的 大 型 计算 机 采用 64-bit 寻 址 。 这 是 因为 在 科学 计算 中 ， 数 据 大 都 是 64- 
bit 浮 点 数 (参考 第 2 章 )。 正 是 因为 科学 计算 偏爱 64-bit 的 数据 表示 形式 ， 很 自然 ， 这 些 计算 机 的 内 
存 系统 也 被 设计 成 了 64-bit 寻 址 规格 的 。 


3.5.3 例子 : 22Xx3 内 存 


图 3-21 所 示 是 一 个 2? x 3 大 小 的 内 存 。 其 中 ，2 代表 内 存 的 地 址 空间 大 小 为 4，3 代 表 寻 址 能 力 
为 3-bit 宽 度 。 即 该 内 存 的 地 址 空间 为 4 并 按 3 位 寻 址 。 大 小 为 2 的 内 存 地 址 需要 2-bit 来 表示 ， 寻 址 能 
力 为 3， 意 味 着 每 个 内 存 位 置 能 存储 3-bit 信 息 。 内 存 访问 需要 对 地 址 进行 译 码 ， 即 译 码 器 将 输入 
4[1:0] 译 码 为 4 个 输出 线 ， 即 4 根 “ 字 线 ”(word line)。 如 图 3-21 所 示 ， 内 存 中 每 个 字 线 上 包含 3 个 
bit 〈 即 1 个 字 )， 这 就 是 “ 字 线 ”称呼 的 由 来 。 读 取 内 存 时 ， 只 要 设置 地 址 值 4[1:0]， 则 对 应 的 字 线 
被 选中 输出 。 内 存 中 每 个 bit 都 与 对 应 的 字 线 相 与 《AND)， 与 其 他 字 线 上 的 相同 bit 相 或 (OR)。 由 
于 任 一 时 刻 有 且 仅 有 一 个 字 线 被 选中 ， 所 以 这 实际 上 就 是 一 个 bit 选 择 的 多 路 开关 。3 个 这 样 的 bit 级 
多 路 开关 并 连 在 一 起 ， 就 是 一 个 字 选 开关 ， 即 一 次 读 出 一 个 字 。 


4[1 : 0] D[2] Di[1] Di[0] 
































D[2] D[1] D[0] 
图 3-21 22 x 3-bit 内 存 的 门 电路 图 


图 3-22 所 示 是 地 址 3 数据 读 取 的 流程 示意 图 。 数 值 3 的 码 字 是 11， 所 以 4[1:0] = 11 的 译 码 结果 是 ， 
最 下 面 的 字 线 被 选中 (其 他 3 根 字 线 未 被 选中 )。 该 线 上 3 个 bit 的 内 容 为 “101”， 所 以 这 3 个 bit 与 字 线 
相 与 (AND) 之 后 ， 输 出 为 “101”， 进一步 又 输入 给 OR 门 。 由 于 其 他 3 个 字 线 信号 都 为 0， 所 以 分 
别 受 AND 门 控制 ，OR 门 上 其 他 3 个 输入 必然 为 0。 结 果 是 数据 线 D[2:0] = 101， 也 就 是 说 ，OR 门 输 
出 的 是 位 置 3 存储 的 内 容 。 内 存 的 写 操作 过 程 与 此 类 似 。 地 址 线 4[1:0] 的 内 容 经 过 译 码 器 之 后 ， 选 中 
对 应 的 字 线 ， 然 后 在 WE 信号 的 控制 下 ， 将 Di2:0] 上 已 设置 的 数据 写 入 字 线 选中 的 门 控 锁 存 器 中 。 
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A[1 : 0] Di2] DI{1] D0] 


Do 


OT 
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D[2] DUL] D[0] 


图 3-22 从 2? x 3-bit 内 存 的 地 址 3 中 读 取 数据 


3.6 时 序 电 路 


在 3.3 节 中 ， 我 们 讨论 了 多 路 开关 、 译 码 器 及 全 加 器 等 儿 种 逻辑 电路 ， 这 些 逻 辑 电 路 有 一 个 共 
同 的 特点 ， 就 是 电路 的 输出 完全 取决 于 电路 当前 的 输入 信号 ， 我 们 称 这 类 逻辑 电路 为 组 合 逻辑 电 
B (Combinational Logic Circuit)。 组 合 逻 辑 电 路 的 特点 是 ， 它 不 关心 电路 以 前 的 状态 ， 电 路 当前 
的 输出 完全 取决 于 电路 当前 的 输入 。 也 就 是 说 ， 它 不 能 存储 电路 的 “历史 ”信息 。 但 在 3.4 和 3.5 节 
中 讨论 的 逻辑 结构 ， 则 能 够 存储 信息 ， 如 3.4 节 的 存储 单元 和 3.5 节 的 2 x 3-bit 大 小 的 内 存 ， 但 是 这 


些 结构 单元 却 不 具备 数据 处 理 能 力 。 
= 


本 节 我 们 将 介绍 既 能 处 理 数据 又 能 存储 
Der 


数据 的 逻辑 电路 单元 。 这 种 逻辑 电路 的 输出 
图 3-23 ”时序 逻辑 电路 的 结构 框图 








既 与 当前 电路 输入 相关 ， 更 重要 的 是 ， 它 又 。 输入 
与 之 前 电路 的 状态 相关 ， 我 们 称 这 种 电路 为 
“时 序 逐 辑 电 路 ” (Sequential Logic Circuit), 
时 序 逻 辑 电 路 和 组 合 逻辑 电路 的 不 同 之 处 是 : 
时 序 逻 辑 电 路 中 具有 存储 单元 ， 可 以 跟踪 电 
路 以 前 的 状态 。 图 3-23 是 时 序 逻辑 电路 的 结 
构 杠 图。 值得 注意 的 是 ， 时 序 逻 辑 电路 的 输 
出 是 由 电路 当前 输入 信号 和 存储 单元 信息 共 
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同 决定 的 ， 存 储 单元 中 的 数据 反映 了 电路 之 前 的 状态 。 

时 序 逻 辑 电 路 主要 用 于 实现 有 限 状态 机 。 有 限 状 态 机 被 广泛 用 于 各 种 工程 领域 ， 如 电气 控制 、 
机 械 系统 、 航 空 等 。 例 如 ， 控 制 红 、 黄 、 绿 三 种 颜色 的 交通 灯 控 制 器 就 是 一 个 很 好 的 例子 ， 它 根 
据 当 前 颜色 (历史 信息 ) 及 传感器 输入 信息 ， 设 置 交通 灯 的 下 一 个 颜色 状态 。 交 通 传感器 可 以 是 


道路 上 的 绊 绳 或 光电 器 等 交通 监测 设备 。 
在 第 4 章 中 我 们 还 将 介绍 ， 在 冯 ' 诺 伊 曼 体系 结构 中 ， 有 限 状 态 控制 器 是 怎样 控制 整个 计算 机 


系统 的 工作 流程 的 ， 它 将 是 计算 机 的 心脏 。 


3.6.1 组 合 密码 锁 

通过 一 个 简单 例子 ， 我们 将 看 到 时 序 逻 辑 电 路 和 组 合 逻 辑 电路 之 间 的 不 同 。 假 设 某 人 希望 将 
自行 车 锁 住 ， 但 却 又 不 想 随身 携带 钥匙 。 那 么 ， 他 可 以 使 用 “组 合 密码 锁 9”(Combination Lock) 
之 类 的 东西 。 有 了 密码 锁 ， 他 只 需要 记 住 开锁 的 “组 合 码 ”(combination) 即 可 。 图 3-24 所 示 是 两 
种 常用 的 密码 锁 。 





a) b) 
图 3-24 两 类 密码 锁 的 例子 


图 3-24a 所 示 的 密码 锁 有 一 个 拨号 盘 ， 周 围 刻 有 0~30 等 数字 。 要 打开 这 个 锁 ， 必 须知 道 密码 组 
合 。 假 设 密码 组 合 是 R13-L22-R3， 则 意味 着 开锁 方法 是 ， 右 转 两 满 图 并 继续 ， 直 到 指针 指向 13 
( 即 R13) ， 然 后 左 转 一 满 圈 并 继续 ， 直 到 指针 指向 22( 即 L22) ; 再 右 转 一 满 圈 并 继续 ， 直 到 指针 
指向 3 ( 即 R3)。 于 是 ， 锁 打开 了 。 其 中 的 关键 是 旋转 的 “顺序 ”。 如 果 右 转 两 圈 停 在 20， 然 后 向 左 
转 一 圈 停 在 22， 最 后 右 转 一 圈 指 向 3。 虽 然 最 后 停 住 的 数字 也 是 3， 但 这 样 锁 是 打 不 开 的 。 为 什 
么 ? 因为 密码 锁 能 “ 记 住 ”之 前 的 数字 ， 并 将 当前 输入 值 (R3) 与 历史 操作 结合 ， 最 终 决 定 是 否 
将 锁 打 开 。 这 个 例子 就 是 典型 的 “时 序 结构 。 

图 3-24b 是 另 一 类 密码 锁 。 该 密码 锁 有 4 个 轮子 ， 每 个 轮子 上 的 数字 是 0~9。 分 别 转 动 每 个 轮子 ， 
如 果 4 个 轮子 上 的 数字 排列 和 设 定 密码 吻合 ， 则 锁 自 动 打开 。 这 种 锁 的 特点 是 ， 它 能 否 被 打开 只 与 
4 个 轮子 当前 的 状态 相关 ， 而 与 轮子 旋转 过 程 无 关 。 这 个 例子 则 属于 “组 合 结构 ”。 

很 奇怪 的 是 ， 在 我 们 的 日 常生 活 中 ， 并 不 区 分 这 两 类 锁 ， 统 称 它们 为 “组 合 密 码 锁 ”。 淮 确 地 
说 ， 前 者 应 该 被 称 为 “时 序 锁 ”(Sequential Lock) ， 后 者 才 是 真正 的 “组 合 密码 锁 ” 


(Combination Lock), 


日 “所谓 “ 组 合 密码 锁 " ， 就 是 中 文 俗称 的 “密码 锁 " 。 翻 译 成 “密码 锁 ” 可 能 更 直观 、 形 象 些 ， 但 考虑 到 文中 
作者 有 意 区 分 “组 合 密码 锁 ” 和 “时 序 密码 锁 ”(sequence lock)， 所 以 在 此 将 其 翻译 为 “组 合 密码 锁 ”。 
一 一 译 者 注 

OG JEXÆ "turning the dial two complete turns to the right”， 应 该 翻 详 为 “ 右 转 两 满 图 ”。 从 原理 .上 来 说 ，1 轿 
或 是 2 圈 并 不 重要 。 从 细节 上 考虑 ， 在 解锁 过 程 的 开始 〈 当 且 仅 当 ) 转 2 圈 (而 不 是 1 圈 ) ， 可 以 起 到 “复位 ” 
的 作用 ， 或 许 原因 如 此 ， 仅 供 参 考 。 一 一 译 者 注 
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3.6.2 状态 的 概念 


图 3-24a 所 示 ， 在 时 序 密 码 锁 的 工作 机 制 中 ， 必 须 记 录 每 次 旋转 的 数字 及 其 顺序 。 事 实 上 ， 
“R13-L22-R3” 是 惟一 可 以 开锁 的 序列 。 例 如 ， 序 列 R13-L29-R3、R10-L22-R3 都 不 能 开锁 。 问 题 
是 ,在 任何 时 候 ， 旋 转 是 锁 系统 的 惟一 输入 。 

下 面 是 图 3-24a 所 示 密 码 锁 开锁 过 程 经 历 的 主要 状态 阶段 : 

A， 闭 锁 状 态 ， 且 无 外 部 操作 。 

B. 闭锁 状态 ， 刚 完成 R13 操 作 。 

Cc 。 团 锁 状 态 ， 已 完成 R13~L22 操 作 序列 。 

D .开锁 状态 打开 。 

如 果 A、B、C、D 代 表 其 中 的 各 个 阶段 ， 则 称 它们 为 密码 锁 的 状态 。 

在 计算 机 工程 中 ， 状 态 是 一 个 非常 重要 的 概念 ， 它 在 各 类 工程 技术 中 都 非常 重要 。 系 统 的 某 
个 状态 ， 可 以 理解 为 是 系统 在 特定 时 刻 和 特定 条 件 下 的 快照 (snapshot), 

换 名 话说 :系统 的 状态 是 系统 中 所 有 组 成 要 素 在 拍照 时 刻 的 一 个 “快照 。 

图 3-24a 所 示 的 密码 锁 有 四 个 状态 :开锁 (状态 D)、 闭 锁 且 无 外 部 操作 (状态 A)、 闭 锁 但 已 接 
受 一 个 正确 序列 码 (状态 B)、 闭 锁 但 已 接受 两 个 正确 序列 码 (状态 C)， 这 些 是 可 能 存在 的 所 有 状 
态 。 试 问 ， 果真 如 此 吗 ? 是 否 存 在 第 5 种 可 能 的 状态 ? 

可 以 通过 状态 来 描述 系统 的 例子 很 多 。 例 如 ， 记 分 牌 可 以 代表 篮球 比赛 的 状态 。 图 3-25 中 的 
记分 牌 表达 的 信息 包括 : TEXAS 队 和 OKLAHOMA 队 当前 比分 是 “73:68”， 下 半 时 ， 比 赛 剩 余 时 
间 是 “7 分 38 秒 ”， 投 篮 时 限 还 剩 14 秒 ，TEXAS 队 目前 控 球 ， 两 队 分 别 犯 规 4 次 。 这 就 是 篮球 比赛 的 
一 个 快照 ， 它 描述 了 比赛 当前 的 状况 。 假 设 12 秒 后 TEXAS 队 投 中 两 分 ， 则 记分 牌 更 新 。 更 新 后 ， 
记分 牌 显示 信息 是 : TEXAS 和 OKLAHOMA 队 比分 为 “75:68”， 下 半 时 剩 时 “7 分 26 秒 ”， 投 篮 时 
限 复位 为 25 秒 人 SS，OKLAHOMA 队 控 球 。 


O| OKLAHOMA 


犯规 : 4 


'。 BH 


半 场 吕 € 


0136 
[H 


投篮 倒计时 





图 3-25 一 个 篮球 记分 牌 状态 的 例子 


游戏 “三 子 连珠 ”(tic-tac-toe) 也 可 以 描述 为 状态 表示 方式 。 这 是 一 个 双人 游戏 (当然 ， 也 可 
以 是 人 和 计算 机 对 弈 )。 这 里 ， 状 态 代表 的 是 ， 每 次 计算 机 等 待人 走 下 一 步 棋 的 时 刻 ， 游 戏 的 快照 。 
游戏 规则 如 下 :棋盘 是 一 个 3 x 3 方 格 ， 人 和 计算 机 轮流 填充 棋盘 上 的 空格 ， 分 别 填充 “X”( 人 ) 


号 ”NBA 标准 规定 的 “投球 时 限 ”(shot clock) 是 24 秒 ， 即 24 秒 内 必须 投 签 ， 否 则 违例 。 一 一 译 者 注 
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H “O (GRI) ; 人 先 走 ， 胜 者 是 最 先 将 三 个 X 或 O 排 成 一 条 直线 的 ， 这 条 直线 可 以 是 水 平 的 、 
垂直 的 或 斜 线 。 

初始 状态 如 图 3-26a 所 示 ， 所 有 方 格 为 空 。 图 x xlolx 
3-26b 是 游戏 进行 中 的 一 个 状态 ， 代 表 目 前 轮 到 人 
(X) 走 第 二 步 棋 了 。 状 态 表 明 他 /她 的 第 一 步 是 在 棋 
盘 左上 角 填 了 X， 而 计算 机 的 第 一 步 则 是 在 中 心 位 置 
填 了 O。 如 图 3-26c 所 示 状 态 表明 ， 人 在 第 二 步 选 择 
了 右上 角 填 X， 而 计算 机 随后 在 顶 行 中 间 填 O。 图 3-26 三 子 连 珠 的 三 个 状态 


3.6.3 有 限 状 态 机 


正如 我 们 所 见 ， 状 态 是 系统 各 相关 部 件 在 特定 时 刻 的 一 个 快照 。 不 同 的 时 刻 ， 系 统 处 于 不 同 
的 状态 。 所 以 ， 通 常 我 们 使 用 “有 限 状 态 机 ”(Finite State Machine, FSM) 来 描述 系统 的 行为 。 

有 限 状态 机 由 五 个 组 成 部 分 : 

(1) 状态 (有 限 数目 )。 

(2) 外 部 输入 (有限 数 目 )。 

(3) 对 外 输出 (ARKE). 

(4) 任意 状态 间 迁 移 ( 显 式 注 明 )。 

(5) 对 外 输出 操作 (BEREH). 

状态 集合 表示 系统 可 能 处 于 的 所 有 状态 ， 状 态 迁 移 表 示 从 一 个 状态 转换 到 另 一 个 状态 所 需要 
的 各 种 条 件 。 

1. 状态 图 

有 限 状 态 机 的 常用 表达 方式 是 状态 图 (state 
diagram) 。 图 3-27 是 一 个 状态 图 的 例子 。 一 个 状态 
图 由 状态 节点 和 节点 间 的 连接 线 组 成 。 其 中 ， 每 
个 状态 节点 代表 系统 的 一 个 状态 ， 连 线 和 箭头 代 
表 一 个 状态 到 另 一 个 状态 的 转换 。 术 语 中 ， 我 们 
称 这 是 一 个 从 “当前 状态 ”到 “下 一 状态 ”的 转 
移 。 图 3-27 所 示 的 状态 图 中 包含 3 个 状态 和 6 个 状 
态 转 移 。 注 意 ， 从 状态 7 到 状态 X 不 存在 转移 条 件 。 

通常 ， 当 前 状态 的 转移 存在 多 个 选择 (下 一 
状态 )。 最 终 的 转移 取决 于 外 部 输入 。 例 如 ， 在 图 3-27 中 ， 如 果 当 前 状态 为 X 且 输入 为 0， 则 下 一 状 
态 为 Y， 如 果 当 前 状态 为 X 且 输入 为 1， 则 下 一 状态 为 Z。 总 之 ,下 一 状态 取决 于 系统 的 当前 状态 和 
当前 输入 。 | 

然而 ， 系 统 输出 既 可 以 由 当前 状态 惟一 决定 ， 也 可 以 由 当前 状态 和 当前 输入 共同 决定 。 在 我 
们 将 要 学 习 的 所 有 例子 中 ， 系 统 输出 都 是 由 当前 状态 来 决定 的 。 如 图 3-27 所 示 ， 当 系统 状态 为 X 时 ， 
系统 输出 101， 当 系 状态 为 时， 系统 输出 110， 当 系统 状态 为 Z 时 ， 输 出 001。 

图 3-28 所 示 是 密码 锁 系 统 ( 见 图 3-24a) 所 对 应 的 状态 图 。 假 设 解锁 密码 是 “R13-L22-R3”， 
标识 为 4、8、C、D 的 4 个 状态 代表 了 “ 锁 的 当前 状态 ( 开 或 闲 )” 以 及 “至 今 为 止 正确 操作 的 次 数 ” 
等 信息 ， 系 统 输入 是 可 能 的 密码 盘 转动 操作 ， 系 统 输出 是 “开锁 ”或 者 “闭锁 ” 。 显 然 ， 系 统 输出 
与 每 个 状态 都 紧密 相关 ， 即 状态 处 于 4、B、C 时 ， 系统 输 出 为 “ 闭 ”， 处 于 状态 D 时 , 输出 为 “ 开 ”。 
任意 状态 的 所 有 转移 线 则 代表 了 在 当前 状态 下 的 所 有 可 能 操作 (输入 )。 例 如 ， 当 系统 处 于 状态 B 
时 ， 所 有 可 能 的 输入 操作 可 以 描述 为 :“ 左 转 至 22 (L22)” 或 “ 除 L22 之 外 的 任何 操作 ”。 因 此 ， 对 


a) b) c) 





图 3-27 一 个 状态 图 的 例子 
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应 这 两 种 可 能 ， 从 状态 8 出 发 的 转移 线 为 两 条 。 


除 R13 之 
外 的 情况 






图 3-28 对 应 图 3-24 的 密码 锁 状 态 图 


同样 ， 我 们 也 可 以 画 出 篮球 比赛 的 对 应 状态 图 ， 其 中 每 个 状态 点 代表 记分 牌 内 容 。 引 起 状态 
转移 的 可 能 情况 包括 ， 裁判 吹 响 哨 ( 进 球 或 犯规 ) ， 或 是 某 方 队员 得 球 等 。 例 如 ，TEXAS 投 中 2 分 
后 裁判 吹 哨 ， 状 态 就 将 转移 。 但 是 ， 很 快 我 们 就 发 现 ， 描 述 篮球 比赛 所 需 状态 数目 很 庞大 ， 而 状 
态 之 间 的 转移 却 非常 少 。 系 统 的 输入 是 自 上 次 转移 以 来 ， 复 球场 上 可 能 出 现 的 任何 活动 ， 如 
TEXAS 队 投 中 两 分 、OKLAHOMA 队 投 中 三 分 、TEXAS 队 截 球 、OKLAHOMA 队 抢 篮板 成 功 等 等 。 
输出 则 是 最 后 的 比赛 结果 ， 有 三 种 可 能 ， 比赛 正在 进行 中 、TEXAS 队 获胜 或 OKLAHOMA 队 获胜 。 

试问 ， 你 能 在 TEXAS : OKLAHOMA 上 比分 等 于 “30:28” 和 “30:30” 等 两 个 状态 之 间 ， 画 出 
它们 之 间 的 状态 转移 连 线 吗 ? 可 参考 习题 3.38。 

再 问 ， 请 判断 以 下 情况 是 否 可 能 ? 两 个 状态 分 别 是 ， TEXAS 队 领先 30:28 和 两 队 战 平 30:30， 
但 两 个 状态 之 间 却 不 存在 转移 线 (或 转移 关系 ) ? 可 参考 习题 3.39。 

2. 时 钟 

下 面 开 始 讨论 有 限 状 态 机 的 一 个 重要 特性 一 一 状态 转移 的 触发 机 制 。 所 谓 “ 触 发 *， 比 如 在 时 
序 锁 中 ， 前 一 轮 拨号 结束 、 下 一 个 逆 方 向 拨号 开始 之 前 ， 就 是 它 的 转移 触发 ， 而 在 篮球 比赛 中 ， 
裁判 的 哨 声 、 投 篮 或 对 方 断 球 等 ， 是 状态 转移 的 触发 条 件 。 

通常 ， 状 态 转移 是 通过 时 钟 电 路 来 触发 的 。 所 谓 时 钟 ， 是 这 样 一 个 信号 ， 低 电 平 . (逻辑 0) 和 
高 电 平 GERI) 交替 变换 。 换 个 数字 逻辑 的 说 法 是 ， 时 钟 是 0 和 1 交替 变换 的 信和 号 。 图 3-29 是 时 钟 
的 信号 量 和 时 间 之 间 的 国 数 关系 ， 时 钟 周期 (clock cycle) 是 指 时 钟 信号 不 断 变换 的 间隔 时 间 。 





| 一 个 了 时钟 > 一 个 时 钟 一 wie 一 一 个 时 钟 em 
周期 周期 1 周期 1 


+ 


图 3-29 一 个 时 钟 信 号 的 例子 
在 电路 实现 中 ， 有 限 状 态 机 的 状态 转移 发 生 在 每 个 时 钟 周期 的 起 始 时 刻 。 
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3.6.5 有限 状态 机 的 实现 


我 们 将 以 交通 警告 牌 作为 例子 ， 详 细 介 绍 有 限 状 
态 机 的 原理 设计 和 实现 ， 即 交通 警告 牌 控制 器 的 逻辑 
设计 。 如 图 3-30 所 示 ， 交 通 牌 提示 信息 包括 : 危险 、 


右 转 ， 以 及 5 个 指示 灯 (用 数字 1~5 表 示 )。 Og 

Fi fbl 8 RO Ie RE ER £120, ALIE o9 
辑 的 主要 应 用 之 一 。 在 本 例 中 ，“ 系 统 ”是 指 交通 区 © 
告 牌 上 各 个 指示 灯 ， 控 制 器 控制 这 些 指示 灯 开 或 闲 的 危险 
规则 是 ， 在 1 个 周期 内 ， 关 闭 所 有 的 灯 ， 接 下 来 的 周 
期 里 , 打开 指示 灯 1 和 2， 再 之 后 的 周期 里 ,打开 1、2、 zn 


3 和 4 最后， 打开 所 有 的 灯 。 随 后 ， 重 复 以 上 4 个 阶 
B: 灯 灭 ，1 和 2，1、2、3 和 4， 全 亮 。 如 此 反复 ， 其 
中 每 个 周期 持续 时 间 0.5s。 

图 3-31 所 示 是 该 交通 警告 牌 的 状态 机 描述 。 其 中 ， 


状态 机 的 4 个 状态 分 别 对 应 4 种 相关 状况 。 注 意 其 中 状 图 3-30 交通 警告 牌 


态 的 迁移 条 件 ， 如 果 开 关 (switch) BOB (input = 1)， 则 所 有 的 灯 按 以 上 时 序 亮 或 灭 ， 如 果 开 关 
(switch) 断 开 ， 则 状态 立刻 复位 至 初始 态 〈 所 有 灯 都 灭 ) 。 


00 01 





1 
图 3-31 交通 警告 牌 控 制 器 的 状态 图 


图 3-32 所 示 是 有 限 状 态 机 ( 见 图 3-31) 的 时 序 有 逻辑 电路 。 图 3-32a 是 结构 框图 。 注 意 ， 该 系统 
包括 : 一 个 外 部 输入 ， 即 控制 灭 或 亮 的 开关 (switch) ， 三 个 输出 ， 一 是 控制 1 和 2 号 灯 的 点 亮 ， 二 
是 控制 3、4 号 灯 的 点 亮 ， 三 是 控制 5 号 灯 。 系 统 内 部 还 包含 两 个 存储 单元 (element) ， 用 于 记录 控 
制 器 的 当前 状态 ， 它 们 的 值 反 映 了 系统 之 前 的 状态 。 最 后 ， 注 意 系统 内 还 包含 了 一 个 时 钟 电路 ， 
该 时 钟 以 0.5s 的 周期 控制 着 系统 的 状态 转移 。 - 

在 存储 单元 中 ， 需 要 记录 的 历史 信息 (也 是 惟一 相关 的 ) 是 “之 前 状态 ”， 即 在 这 之 前 是 从 哪 
一 个 状态 转移 过 来 的 。 由 于 本 系统 只 有 4 个 状态 ， 因 此 2 个 bit 就 足以 表示 它 。 参 见 图 3-31 中 4 个 状态 
的 2-bit 标 识 。 

1. 224 X H 

图 3-32b 所 示 是 控制 器 中 的 组 合 逻辑 部 分 。 组 合 逻 辑 电 路 的 输出 有 两 组 : 一 是 交通 警告 牌 指示 
灯 的 控制 信号 〈 外 部 输出 ) ， 二 是 输出 给 两 个 存储 单元 的 状态 信息 (内 部 输出 )。 

首先 ， 是 指示 灯 的 控制 输出 。 我 们 之 前 提 过 ， 指 示 灯 控制 只 需要 三 个 输出 即 可 。 其 中 ，5 号 灯 
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受 控 于 标识 为 X 的 AND 门 输出 ， 因 为 3 号 灯 点 亮 的 惟一 情况 是 在 switch=1 且 控制 器 状态 为 11 之 时 ，3、 
4 号 灯 受 控 于 标识 为 的 OR 门 输出 ， 因 为 这 两 个 灯 在 两 种 状态 下 都 将 点 亮 〈 即 状态 10 和 11) ， 1、2 
号 灯 受 控 于 标识 为 Z 的 OR 门 ， 为 什么 ? 我 们 将 这 个 问题 作为 思考 题 考 考 你 ， 参 见习 题 3.42。 

然后 ， 是 控制 存储 单元 的 内 部 输出 。 如 果 系 统 的 下 一 状态 是 “11” 或 “10”， 则 存储 单元 1 将 
被 设置 为 1。 因 为 读 操 作 只 发 生 在 系统 当前 状态 为 “10” 或 “01” 这 两 种 情况 下 ， 所 以 存储 单元 1 
受 控 于 标识 为 W 的 OR 门 输出 。 试 问 ， 为 什么 说 存储 单元 2 受 控 于 标识 为 U 的 OR 门 ?” 参 见习 题 3.42。 

2. 存储 单元 

最 后 是 控制 器 中 ( 见 图 3-32a) 存储 单元 的 描述 。 有 人 可 能 会 问 “ 为 什么 我 们 不 直接 使 用 3.4 节 
所 示 的 D 锁 存 器 来 作为 存储 单元 呢 ?“。 其 原因 是 ， 在 当前 时 钟 周期 内 ， 存 储 单元 的 输出 是 组 合 逻 
辑 电路 的 一 个 内 部 输入 ， 而 同时 组 合 罗 辑 电路 的 输出 又 是 存储 单元 的 输入 。 该 输入 应 该 等 到 下 一 
个 时 钟 周期 才能 写 人 存储 单元 ， 如 果 使 用 D 锁 存 器 ， 则 当前 周期 开始 输入 时 ， 就 将 覆盖 存储 单元 的 
内 容 (而 不 是 等 到 下 一 周期 )。 





c) 存储 器 单元 (EA BUT SE) 


图 3-32 用 时 序 逻 辑 电 路 实现 交通 警告 牌 


为 了 避免 问题 的 发 生 ， 我 们 采用 一 种 被 称 为 “ 主 从 锁 存 器 ” (master-slave flip-flop) .的 逻辑 电 
路 来 实现 存储 单元 。 如 图 3-32c 所 示 ， 主 从 锁 存 器 由 门限 忆 锁 存 器 构成 。 在 有 时钟 的 前 半 周 期 ， 锁 存 
器 A 内 容 不 会 改变 。 而 锁 存 器 4 的 内 容 将 通过 锁 存 器 8 输出 至 组 合 当 辑 电 路 ， 在 时 钟 的 后 半 周 期 ， 锁 
存 器 8 的 内 容 不 会 改变 ， 即 输出 至 组 合 逻辑 的 内 容 保持 不 变 〈 即 仍然 是 前 半 周 期 的 4 内 容 )。 然 而 ， 
在 后 半 周 期 内 ， 锁 存 器 4 的 内 容 可 能 发 生变 化 。 这 就 是 主 从 锁 存 器 ， 它 使 得 当前 状态 (记忆 内 容 ) 
在 整个 时 钟 周期 内 保持 不 变 ， 而 组 合 逻辑 生成 的 新 状态 值 ， 将 在 后 半 周 期 写 信 锁 存 器 4， 同 时 ， 这 
个 新 内 容 又 将 在 下 一 周期 开始 时 传递 给 锁 存 器 B， 最 终 输入 至 组 合 逻 辑 电 路 。 
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3.7 LC-3 计 算 机 的 数据 通路 
在 第 5 章 中 ， 我 们 将 介绍 一 个 被 称 为 LC-3 的 计算 机 ， 而 且 你 还 可 以 在 它 上 面 编写 和 运行 自己 的 


程序 。 图 3-33 所 示 是 LC-3 的 结构 图 ( 即 数据 通路 (data path) ) ， 以 及 控制 LC-3 的 有 限 状 态 机 。 数 
据 通路 包含 了 在 计算 机 内 核 (core) 中 所 有 与 处 理 信息 相关 的 逻辑 结构 。 : 








人 PC 输出 的 门 
控 (GatePC) 





MARMUX 输 出 的 7^ 
门 控 信 号 
(GATEMARMUX) 












寄存 器 文件 
^| (REGFILE) 











ALU 输 出 的 门 
控 信号 
(GATEALU) 


















输出 


输入 
(OUTPUT) 


(INPUT) 








内存 
(MEMORY) 











MEM.EN, R.W 


图 3-33 LC-3 计 算 机 的 数据 通路 
训 无 疑问 ， 图 3-33 看 起 来 非常 复杂 。 现 在 你 不 必 完 全 掌握 它 ， 因 为 相关 的 知识 都 还 未 介绍 。 
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我 们 将 在 第 5 章 介 绍 相关 知识 及 其 工作 原理 。 但 是 ， 从 这 张 图 中 ， 你 至 少 可 以 看 到 完成 一 个 计算 机 
所 需要 的 基本 结构 ， 我 们 都 已 熟悉 这 些 基本 结构 ， 同 时 还 了 解 它们 是 怎样 由 门 电 路 实现 的 。 如 数 
据 通路 中 的 PC、 了 及 、MAR 和 MDR 等 ， 都 是 宽度 为 16-bit 的 寄存 器 ， 用 斜 线 标识 的 总 线 (bus) 及 标 
识 在 总 线 旁 边 代表 总 线 宽 度 的 数字 ， 如 16 代 表 16 根 线 ， 每 条 线路 包含 1 个 bit 信 息 ， 再 如 NW、Z 和 P 等 
是 1-bit 寄 存 器 ， 这 些 寄存 器 都 是 “ 主 从 锁 存 器 ”结构 ， 图 中 还 有 5 个 多 路 开关 ， 它 们 是 PC 寄存 器 的 
给 入 选择 、MAR 寄 存 器 的 输入 选择 、 算 术 逻 辑 单元 (ALU) B 端 的 输入 选择 ， 以 及 加 法 器 的 两 个 
输入 选择 端 。 而 在 第 5 章 ， 我 们 将 要 思考 的 问题 是 : 为 什么 以 及 怎样 才能 让 这 些 基本 结构 互 连 在 一 
起 ， 以 使 得 LC-3 能 执行 程序 ? 目前 ， 让 我 们 仅仅 “欣赏 ”一 下 这 些 看 起 来 很 眼熟 的 组 成 部 件 。 在 
第 4 章 和 第 5 章 ， 我 们 将 对 这 些 结构 单元 进一步 抽象 ， 然 后 将 它们 互 连 。 形 成 一 台 真 正 可 运行 的 计 
算 机 。 
3.8 习题 
31 试 填写 在 不 同情 况 下 ， 两 种 MOS 管 的 通 、 断 状态 。 
nA) p% 

Gate = 1 

Gate = 0 
32 试 在 图 中 空缺 的 地 方 画 上 “有 连 线 ”还 是 “没有 连 线 ”， 条 件 是 输入 IN 等 于 逻辑 “1” 肝 ， 输 

出 OUT 为 逻辑 “0”。 


"P 
zl Í— our-o 


3.3. 两 输入 AND 门 和 两 输入 OR 门 都 是 “两 输入 逻辑 ”的 例子 ， 试 问 还 存在 多 少 种 可 能 的 “两 输入 
BE GER: 将 2 个 输入 和 1 个 输出 的 对 应 关系 ， 而 不 仅仅 是 数值 ， 做 排列 组 合 。 换 句 话 说， 
就 是 可 能 的 真 值 表 数 目 ) ? 

34 试 在 图 中 空缺 的 地 方面 上 “有 连 线 ” 还 是 “没有 连 线 ” ， 以 使 得 输出 C 为 轴 辑 “1"。 再 给 出 输 
出 C 为 逻辑 “0” 的 情况 下 ， 输 入 4 和 8 的 组 合 。 
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3.5 给 出 对 应 于 图 3-34 所 示 电 路 的 真 值 表 。 





图 3-34 习题 3.5 的 结构 框图 
3.6 ”填写 对 应 于 图 3-35 所 示 电 路 的 真 值 表 ， 并 写 出 ZLA、B 为 变量 的 逻辑 表达 式 。 


E ni 


图 3-35 习题 3.6 的 结构 框图 
37 试 找 出 下 图 中 的 一 个 严重 错误 (提示: 匹配 不 同 输入 下 电路 的 输出 ) 。 


A-d 全 3 


A—] | Hes 
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3.8 下 面 电路 对 应 于 逻辑 表达 式 y = NOT(A AND (8 OR C)) 的 实现 。 请 为 电路 标注 对 应 的 输入 、 


输出 符号 。 


Y = A AND (B OR C) 


b— 
—4 
-一 


— 
A 二 


3.9 ”填写 对 应 于 逻辑 表达 式 NOT(NOT(4) OR NOT(B)) 的 真 值 表 ， 它 对 应 的 是 什么 逻辑 门 ? 








A B NOT(NOT(A)OR NOT(B)) 





A B NOT(NOT(AJOR NOT(B)) 








3.11 


3.12 


3.13 
3.14 
3.15 


a. 画 出 3 输入 与 门 和 或 门 的 MOS 晶 体 管 级 电路 图 。 提 示 : 参考 图 3-6a 和 图 3-7a， 对 其 进行 


扩展 。 

b. 在 问题 8 的 电路 图 上 ， 对 应 下 列 条 件 ， 标 注 电 路 图 中 MOS 管 的 导 通 OER) 或 断 开 (无 
连 线 )。 

(1) A4=1,8=0,C=0 

(2) A=0,B=0,C=0 

(3) A=1,B=1,C=1 

参考 习题 3.11a， 画 出 3 输入 译 码 器 的 MOS 级 电路 图 。 对 应 译 码 器 的 每 一 个 输出 ， 写 出 其 对 应 
的 输入 组 合 。 

试问 5 输入 译 码 器 应 该 有 多 少 根 输出 线 ? 

试问 16 和 输入 多 路 开关 应 该 有 多 少 根 输出 线 ? 应 该 有 多 少 根 选择 线 ? 

如 果 4 和 8 是 4-bit 无 符号 整数 0111 和 1011， 试 用 图 3-15 所 示 的 全 加 器 计算 4 与 8 之 和 9， 并 填写 
下 面 表格 。 请 用 十 进 制 加 法 验证 4 和 B 之 和 ， 是 否 与 9 吻合 ? 为 什么 ? 


中田 本 | 
g Ei 
[= 


3.16 ”给 定 下 面 真 值 表 ， 请 画 出 对 应 的 逻辑 电路 (提示; 参考 3.3.4 节 的 实现 算法 ) 。 


A B C Z 
0 0 0 1 
0 0 1 0 
0 1 0 0 
0 1 1 1 
1 0 0 0 
1 0 I 1 
1 1 0 1 
1 1 1 0 


3.17 a 给 定 4 个 输入 A、B、C、D，1 个 输出 Z， 设 计 一 个 真 值 表 ， 要 求 其 中 至 少 有 7 种 输入 组 合 的 
逻辑 输出 为 1 ( 另 : 该 真 值 表 共有 多 少 行 ?)。 
b. 画 出 以 上 真 值 表 对 应 的 门 级 逻辑 电路 。 参 考 3.3.4 节 的 实现 。 
3.18 ”基于 与 门 、 或 门 和 非 门 ， 实 现 以 下 函数 。 其 中 ，4 和 有 为 输入 ， 大 为 输出 。 
a. 匹 为 1， 当 且 仅 当 4=0、B8 = 1。 
b. F 为 1， 当 且 仅 当 4 2 1, B=0。 
c. 基于 a 和 b 的 答案 ， 实 现 一 个 1-bit 加 法 器 。 该 1-bit 加 法 器 的 真 值 表 如 下 所 示 : 


A B Sum 
0 0 0 
0 1 1 
1 0 1 
1 1 0 


d. 试问 ， 能 否 使 用 4 个 完全 相同 的 1-bit 加 法 器 (如 c 中 的 加 法 器 ) 实现 一 个 4-bit 加 法 器 ? 为 
什么 不 可 以 ?缺少 什么 信息 ?提示 : 当 4 和 B 都 为 1 时 ， 和 为 9， 其 中 什么 信息 被 丢失 了 ? 

3.19 ”图 3-36 所 示 的 逻辑 电路 (一) 有 3 个 输入 A、B、C， 图 3-37 的 逻辑 电路 (二 ) 有 两 个 输入 4、 
B， 两 个 电路 的 输出 都 是 D。 但 两 者 之 间 存 在 本 质 的 区 别 是 什么 ? 提示 : 当 输 入 4 从 逻辑 0 变 
为 逻辑 1 时 ， 两 个 电路 有 什么 不 同 ? 


A B 


图 3-36 习题 3.19 的 逻辑 电路 (一 ) 图 3-37 习题 3.19 用 到 的 逻辑 电路 (二 ) 
3.20 画 出 下 面 真 值 表 对 应 的 门 级 电路 图 ， 以 及 对 应 的 晶体 管 级 电路 图 ， 并 对 照 真 值 表 验 证 晶体 管 
级 电路 图 是 否 正确 。 
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Mo ni f (ino, in) 
0 0 1 
0 I 0 
1 0 1 
1 1 1 


3.21 我 们 通常 称 8-bit 为 1 个 字 节 《byte) ，4-bit 为 一 个 半 字 节 (nibble)。 如 果 一 个 byte 寻 址 的 内 存 
的 地 址 表示 宽度 是 14-bit， 试 问 该 内 存 包 含 多 少 个 nibble? 

3.22 试 基于 “2 选 1” 多 路 开关 实现 一 个 “4 选 1” 多 路 开关 。 注 意 ,“4 选 1” 多 路 开关 包含 4 个 输入 、 
2 个 选择 线 、1 个 输出 。 写 出 该 电路 对 应 的 真 值 表 。 

323 已 知 图 3-38 所 示 的 逻辑 电路 ， 填 写真 值 表 中 2Z 的 值 。 


A B C Z 
0 0 0 
0 0 1 
0 1 0 
0 1 1 
1 0 0 
l 0 1 
1 1 0 
1 1 1 
A 
B Z 
C 


图 3-38 习题 3.23 用 到 的 结构 框图 


3.24 a. 图 3-39 所 示 是 在 大 多 数 处 理 器 中 都 用 到 的 逻辑 电路 ， 其 中 每 个 方 框 是 一 个 全 加 器 。 试 问 ， 
信和 号 X 的 作用 是 什么 ? 或 者 说 ，X = 0 和 X = 1， 电 路 输出 有 什么 不 同 ? 


A3 B3 C3 A2 B2 C2 A1 Bl C1 AO BO CO 
T H i 
m T 
十 
进位 输入 进位 输入 





83 82 S1 so 
图 3-39 结构 框图 
b. 试 设计 一 个 加 /减法 器 。 电 路 能 根据 X， 选 择 是 执行 A + 8 或 是 4-B。 提示 : 参考 图 3-39， 
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3.25 


3.26 


3.27 


3.28 


并 在 其 基础 上 实现 。 

通常 ， 逻 辑 结构 的 执行 速度 取决 于 输入 和 输出 端 之 间 的 “ 门 ” 数 目 。 假 设 AND、OR 和 NOT 
门 的 传输 延迟 都 是 一 个 “ 门 延迟 ”时 间 单 位 。 例 如 ， 我 们 说 图 3-11 所 示 译 码 器 的 输入 和 输出 
之 间 延 迟 时 间 是 2 (经 过 两 个 逻辑 门 )。 试 问 : 

a. 如 图 3-12， 两 输入 多 路 开关 的 传输 时 延 是 多 少 ? 

b. 如 图 3-15，1-bit 全 加 器 的 传输 时 延 是 多 少 ? 

c. 如 图 3-16，4-bit 全 加 器 的 传输 时 延 是 多 少 ? 

d. 假设 将 4-bit 全 加 器 扩展 到 32 人 位， 传输 时 延 又 是 多 少 ? 

之 前 介绍 过 ， 加 法 器 是 由 多 个 独立 单 bit 加 法 单元 (slice) 组 成 的 。 每 个 加 法 单元 将 4 和 B 两 
个 bit 相 加 ， 并 生成 进位 (carryin bit) 和 累加 和 位 (sum bit) ， 我 们 称 之 为 “全 加 器 ” (full 
adder)。 假 设 我 们 有 1 个 3-8 译 码 器 和 2 个 6 输入 OR 门 (如 下 图 所 示 )。 试 间 ， 能 否 基 于 这 3 个 
逻辑 单元 构建 出 一 个 全 加 器 ? 如 果 可 以 ， 请 实现 (提示 : 如 果 OR 门 任 一 输入 空缺 ， 可 以 将 
其 置 为 输入 0， 以 免 产 生 副 作用 ) 。 





看 图 答题 : 


S 


a. 选择 线 $ = 0 时 ， 电 路 输出 是 多 少 ? 或 者 说 ， 不 同 的 输入 4 对 应 的 输出 Z 是 多 少 ? 
b. 如 果 将 选择 线 $ 从 0 变 为 1， 输 出 有 什么 变化 ? 


c. 该 逻辑 电路 是 一 个 存储 单元 吗 ? 
假设 已 有 二 进 制 加 法 器 ， 如 果 准 备 设 计 一 个 2-bit 乘 法 器 。 乘 法 器 输入 分 别 是 4[1:0] 和 B[1:0]， 


输出 是 7 (4[1:0] 和 B[1:0] 相 乘 的 结果 )， 表 示 为 : 
Y = A[1:0] x B[1:0] 
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3.29 


3.30 


3.31 


3.32 
3.33 


£33 


a.4[1:0] 所 能 表示 的 最 大 值 是 多 少 ? 

b. B[1:0] 所 能 表示 的 最 大 值 是 多 少 ? 

c. 了 最 大 的 可 能 值 是 多 少 ? 

d. 表示 了 至 少 需 要 多 少 bit 宽 度 ? 

e. 画 出 乘法 运算 的 真 值 表 (4 个 输入 : 4[1]、A[0]}、B[1]、B8[0])。 

f. 对 照 真 值 表 ， 给 出 输出 Z[2] 的 逻辑 实现 (只 允许 使 用 与 、 或 和 非 门 )。 

假设 一 个 16-bit 寄 存 器 原先 保存 了 一 个 值 。 如 果 再 向 该 寄存 器 写 入 数值 x*75A2， 试问 还 能 恢 
复出 原先 的 寄存 器 内 容 吗 ? 

如 图 3-40 和 图 3-41 所 示 ， 比 较 器 (comparator) 有 两 个 1-bit 的 输入 4 和 8，3 个 1-bit 输 出 G (大 
C). E (SET). L (小 于 )。 如 果 A>B， 则 G = 1， 如 果 4 = B8B， 则 E = 1; AURA«B, WIL = 1。 


A[3] G | 
E 
B[3] 
A[2] G 
E 
B[2] L 
— — — EQUAL 
A[1] G 
E 
B[1] L 
G 
A A[O] G 
E E 
B L BIO L 
图 3-40 习题 3.30 的 结构 框图 图 3-41 习题 3.30 的 结构 框图 
a. 画 出 该 1-bit 比 较 器 对 应 的 真 值 表 。 
A B G E L 
0 0 
0 ] 
1 0 
1 1 


b. 设计 G、E 和 LL 的 逻辑 实现 (使 用 与 、 或 和 非 门 )。 

c. 基于 1-bit 比 较 器 ， 构 建 一 个 4-bit 比 较 器 〈 只 判断 是 否 相 等 )。 即 如 果 4[3:0]j=8[3:01， 则 
EQUAL 输 出 1。 

如 果 计 算 机 的 寻 址 能 力 是 8 字 节 ， 并 且 需 要 3-bit 访 问 内 存 位 置 ， 试 问 该 计算 机 内 存 的 大 小 是 
多 少 〈 以 字 节 为 单位 ) ? 

试 解释 内 存 地 址 (memory address) 和 内 存 寻 址 能 力 (addressability) 之 间 的 区 别 。 

看 图 3-21 中 的 22 x 3-bit 内 存 结构 ， 回 答 下 列 问题 ， 

a. 如 果 读 取 第 4 个 内 存 位 置 (location)， 则 A[1:0] 和 WE 的 值 分 别 是 多 少 ? 
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b. 如 果 将 内 存单 元 (entry) 数目 从 4 个 扩展 到 60 个 ， 问 总 共 需 要 多 少 根 地 址 线 ? 扩展 之 后 ， 
内 存 寻 址 能 力 是 否 发 生变 化 ? 
c. 如 果 程 序 计数 器 它 是 CPU 中 一 个 特殊 的 专用 寄存 器 ， 下 一 章 中 将 详细 介绍 它 的 宽度 不 小 于 
寻 址 60 个 内 存 位 置 所 需要 的 地 址 位 数 。 试 问 ， 在 不 增加 程序 计数 器 宽度 的 情况 下 ， 内 存 还 
能 扩容 多 少 个 位 置 ? | 
3.34 试问， 如 图 3-42 所 示 的 内 存 : 
a. 地 址 空间 是 多 大 ? 
b. 寻 址 能 力 是 多 少 ? 
c. 地 址 为 2 的 单元 内 容 是 什 
A[1] 


9 


R 





D03] 

WE 

Di[3] 
D[2] 

Di[2] 
DUJ 

Dill] 
DIO] 

Di[0] 


图 3-42 习题 3.34 的 内 存 结构 框图 


335 ”假设 内 存 是 22-bit 寻 址 ， 且 寻 址 能 力 为 3-bit。 试 问 该 内 存 的 总 bit 容 量 ? 

336 已 知 一 个 两 输入 组 合 逻辑 。 在 过 去 的 10 个 周期 内 ， 两 个 输入 的 值 分 别 是 01、10、11、01、 
10、11、01、10、11、01。 而 当前 周期 中 ， 两 个 输入 值 为 10。 请 问 之 前 10 个 周期 的 输入 值 
对 当前 输出 是 否 有 影响 ? 

337 ”在 3.6.2 节 中 ， 图 3-24a 所 示 的 密码 锁 有 4 个 状态 A, B, C. D, BD "ESL (D)”、“ 闭 锁 且 无 
输入 (4)”、“ 闭 锁 且 已 输入 1 个 正确 数字 (8)”、“ 闭 锁 且 已 输入 2 个 正确 数字 (C)"。 这 些 是 
密码 锁 可 能 出 现 的 所 有 状态 。 试 问 :是否 存在 第 5 种 状态 ? | 

3.38 ”在 3.6.2 节 的 描述 中 。 是 否 存 在 状态 “TEXAS:OKLAHOMA = 30:28” 到 状态 “比分 相同 ”的 
状态 转移 ?如 果 存 在 ， 试 给 出 两 种 状态 的 记分 牌 内 容 (参考 图 3-25)。 
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3.39 


3.40 
3.41 


3.42 


3.43 


3.44 


£3* 


在 3.6.2 节 描述 的 篮球 比赛 中 。 试 则 ， 假 设 存在 两 个 状态 ，TEXAS 领 先 “30:28” 和 平局 
“30:30” ， 两 者 之 间 是 否 可 能 存在 转移 关系 ? 如 果 存 在 这 种 可 能 ， 试 画 出 记分 牌 予以 解释 。 
并 标识 当时 对 应 的 三 种 可 能 输出 ， 比 赛 进行 中 、 得 克 萨 斯 队 获 胜 、 俄 克拉 荷 马 队 获 胜 。 

试 画 出 3.6.2 节 描述 的 “三 子 连珠 游戏 ”的 有 限 状 态 机 。 

在 IEEE (美国 电气 和 电子 工程 师 学 会 ) 办 公 楼 内 ， 一 瓶 汽水 卖 35 美 分 。 为 方便 售 货 ， 安 装 
了 一 个 自动 售 货 机 。 自 动 售 货机 内 部 有 一 个 控制 器 。 自 动 售 货机 只 接受 3 种 硬币 输入 : 5 美 分 、 
10 美 分 和 25 美 分 硬币 。 每 次 用 户 每 投入 一 枚 硬币 ， 就 按 一 下 按钮 (表示 已 输入 ) 。 如 果 投 入 
硬币 的 面值 总 和 不 小 于 35 美 分 ， 则 自动 售 货 机 输出 一 瓶 汽水 并 且 找 零 。 请 画 出 该 自动 售 货 机 
的 有 限 状 态 机 ， 其 中 每 一 个 状态 表示 已 投入 硬币 的 总 额 (提示 : 共有 7 种 状态 )。 一 旦 用 户 投 
人 硬币 的 总 额 大 于 35 美 分 ， 自 动 售 货 机 就 转移 到 最 后 状态 ， 即 “输出 汽水 并 找 零 ” (提示 : 
有 5 种 这 样 的 最 后 状态 ) 。 如 果 已 处 于 最 后 状态 ， 继 续 投 币 将 重新 开始 。 

参考 图 3-32b。 请 解释 ， 为 什么 1 号 和 2 号 灯会 受 控 于 标识 为 Z 的 OR 门 ?为 什么 第 2 个 存储 单元 
的 下 一 状态 受 控 于 标识 为 0 的 OR 门 ? 

如 图 3-43 所 示 ， 有 限 状 态 机 的 输入 是 X、 输 出 为 Z。 





图 3-43 对 应 习题 3.43 的 图 


请 基于 图 3-43， 回 答 以 下 问题 ; 
a 填写 下 面 的 状态 转移 表 。 其 中 : S0、5S1 代 表 当 前 状态 ，D1、D0 代 表 下 一 状态 。 
S1 so X D1 DO Z 


一 一 一 一 口 口 口 = 
-oorno 
—o-oc—-o0-o0 

一 

o 

一 





b. 画 出 与 状态 转移 表 相对 应 的 状态 转移 图 。 
试 证 明 逻 辑 门 NAND 基 于 自身 是 逻辑 完备 的 (参考 3.3.5 节 ) 。 换 句 话说， 仅仅 使 用 NAND 逻 
辑 就 可 以 实现 AND、NOT 和 OR 等 逻辑 功能 。 - 


第 4 章 ” 冯 : 诺 伊 曼 模 型 


下 面 将 进入 一 个 更 高 的 抽象 层次 。 基 于 第 3 章 所 学 的 决策 单元 和 存储 单元 ， 我 们 可 以 描述 出 一 
个 简单 的 计算 机 模型 ， 即 约翰 13 诺 伊 曼 (John von Neumann) 于 1946 年 提出 的 “ 冯 - 诺 伊 曼 
模型 ”( 又 称 “ 汉 : 诺 伊 曼 体 系 结构 ”)。 


4.1 基本 部 件 


计算 机 的 运行 需要 两 个 前 提 : 一 是 任务 描述 ， 即 描述 计算 机 所 要 完成 的 任务 ， 它 以 程序 (或 
代码 ) 方式 表述 ， 二 是 计算 机 本 身 的 运行 能 力 ， 因 为 它 是 任务 的 具体 执行 者 。 

程序 是 计算 机 指令 的 集合 ， 其 中 每 条 指令 对 应 计算 机 的 一 个 基本 动作 。 指 令 是 程序 的 最 小 单 
fr (或 原子 操作 ) ， 换 句 话说， 一 条 指令 要 么 完整 地 执行 、 要 么 完全 不 执行 ， 计 算 机 无 法 只 执行 指 
令 的 部 分 功能 。 
19464, 15 诺 伊 曼 提 出 了 计算 机 处 理 或 程序 执行 的 基础 模型 ， 图 4-1 中 显示 了 该 模型 的 基本 

组 成 。 需 要 指出 的 是 ， 读 图 是 我 们 在 汉 . 诺 伊 曼 那 张 奇妙 的 原 图 上 所 做 的 一 个 润 饰 修订 版 。 汉 - 

庄 伊 曼 模 型 包括 5 个 组 成 部 分 : 内存 (memory)、 处 理 单元 (processing unit), 、 输 入 (input)、 输 出 
(output)、 控 制 单元 (control unit) 。 其 中 ， 内 存 负责 存放 程序 ， 控 制 单元 负责 指令 的 有 序 执行 。 





处 理 单 元 


ALU (TEMP) 











图 4-1 :8 : 诺 伊 曼 模 型 全 局 图 
下 面 将 详细 描述 冯 : 诺 伊 曼 (von Neumann) 模型 的 五 个 部 分 。 
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4.1.1 内 存 


在 第 3 章 中 ， 我 们 介绍 了 一 个 由 门 电路 和 锁 存 器 组 成 的 、 深 度 为 2、 宽 度 为 3 位 ( 即 2”-by-3-bit) 
的 内 存 。 今 天 的 计算 机 内 存 都 是 2…-by-8-bit 模 式 (2” 个 存储 单元 ， 每 个 单元 可 以 存储 8bit 的 信息 )。 
换 一 种 专业 的 说 法 ， 我 们 称 该 内 存 的 寻 址 空间 为 22， 寻 址 能 力 为 8 位 ， 或 通常 称 之 为 “256 净 字 节 ” 
(256MB) 内 存 。 其 中 256M 指 的 是 2” 个 单元 ， 字 节 (Byte) 指 每 单元 包含 8-bit 信 息 。 字 节 是 8-bit 
的 又 一 种 简称 ， 类 似 加 仑 (gallon) 是 4 夺 脱 的 简称 一 样 。 

我 们 经 常 说 “给 定位 ， 可 以 表达 2 个 单元 "。 这 是 因为 ， 要 区 分 和 定位 2” 个 不 同 单元 ， 每 个 
单元 必须 都 具备 一 个 惟一 的 28 位 地 址 。 例 如 第 5 章 中 ， 在 LC-3 计 算 机 的 1SA 定 义 中 ，LC-3 的 寻 址 空 
间 为 2“， 寻 址 能 力 为 16 位 。 

访问 内 存 的 第 一 步 操作 ， 是 向 内 存 提 供 被 访问 内 存单 元 的 地 址 (参考 第 3 章 )。 以 读 和 写 操作 
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C 读 操作 。 在 第 3 章 中 有 关于 LC-3 的 读 操作 的 描述 ， 首 先 将 被 访问 内 存单 元 的 地 址 放 入 CPU 的 

内 存 地 址 寄存 器 (Memory Address Register, MAR) ， 然 后 发 送 读 信号 通知 内 存 。 由 此 ， 内 
存 将 该 单元 中 存放 的 数据 传送 至 内 存 数据 寄存 器 (Memory Data Register, MDR), 
* 写 操作 。 首 先 将 被 访问 内 存单 元 的 地 址 放 人 和 人 MAR 寄存 器 ， 然 后 将 要 写 和 的 数据 放 入 MDR 寄 
存 器 ,， 最 后 向 内 存 发 送 写 信 号 。 由 此 ，MDR 的 内 容 被 写 人 MAR 指向 的 内 存单 元 。 

在 结束 内 存 的 话题 之 前 ， 我 们 再 回 显 一 下 “内 存单 元 ”的 两 
个 重要 概念 :“ 单 元 地 址 ”及 其 所 存储 的 “单元 内 容 ”。 图 4-2 所 示 
是 一 个 包含 8 个 单元 的 内 存 ， 左 边 数字 代表 其 地 址 (从 0 到 7)， 每 
个 单元 包含 了 一 个 8 位 信息 。 其 中 ， 地 址 为 4 的 单元 存放 的 数据 内 
容 是 6， 而 地 址 为 6 的 单元 存放 的 数据 内 容 是 4。 它 们 代表 的 是 两 种 
完全 不 同 的 情况 。 

最 后 ， 我 们 以 邮局 信箱 为 例 ， 来 比喻 内 存 的 特性 。 每 个 信箱 
都 有 一 个 惟一 的 编号 ， 编 号 如 同 内 存单 元 的 地 址 ， 而 信箱 中 的 信 
件 如 同 内 存单 元 中 存放 的 数据 信息 。 随 着 时 间 的 迁移 ， 信 箱 中 的 
信件 在 不 断 地 变化 ， 但 信箱 编号 永远 不 变 。 内 存 亦 如 此 ， 内 存 每 
个 单元 中 存放 的 数据 内 容 会 不 断 地 变化 ， 但 其 地 址 是 不 会 变化 的 。 


4.1.2 处 理 单元 


处 理 单元 是 信息 真正 被 处 理 的 地 方 。 现 代 计 算 机 的 处 理 单元 已 发 展 得 非常 复杂 ， 它 由 很 多 功 
能 单元 组 成 ， 每 个 功能 单元 负责 一 个 功能 ， 如 除法 操作 、 求 平方 根 等 各 种 功能 单元 。 其 中 ，ALU 
是 最 简单 的 功能 单元 (也 是 汉 : 诺 伊 曼 模 型 中 惟一 的 功能 单元 ) 。ALU 是 “算术 逻辑 运算 单元 ”的 
缩写 。 顾 名 思 义 ，ALU 所 能 完成 的 功能 包括 基本 运算 (如 ADD、SUBTRACT) 和 基本 逻辑 操作 
(如 按 位 AND、OR、NOT) 等 (参见 第 2 章 )。 在 LC-3 中 ， 也 包含 了 一 个 ALU 单 元 ， 它 可 以 完成 
ADD，、，AND 和 NOT 这 三 个 基本 操作 。 

ALU 所 能 处 理 的 量化 大 小 (size of quantity) 通常 被 称 为 该 计算 机 的 “ 字 长 ”(word length), 
而 量化 的 基本 单位 被 称 为 一 个 “ 字 ”(word)。 比 如 LC-3 的 ALU 所 能 处 理 的 量化 大 小 是 16-bit， 所 以 
我 们 称 LC-3 是 一 个 16 位 的 机 器 。 每 类 ISA 都 有 自己 的 字 长 规定 ， 这 取决 于 该 计算 机 的 设计 偏好 。 如 
今 ，PC 机 和 工作 站 《workstation) 级 别 的 计算 机 的 字 长 通常 是 32 位 (如 Inte1 公 司 的 奔腾 IV) 或 64 
位 (如 Sun 公 司 的 SPARC-V9 处 理 器 和 Intel 公 司 的 Itanium 处 理 器 ) ， 对 那些 应 用 于 简单 设备 的 微 处 
理 器 ，8 位 字 长 就 是 够 了 ， 如 传呼 机 (pager)、 录 像 机 (VCR ) 、 手 机 或 蜂窝 电话 (cellular 





图 4-2 单元 6 存放 的 是 数据 4， 
单元 4 存放 的 是 数据 6 


B- 诺 伊 更 模型 67 





telephone) 9, 

通常 ， 在 设计 中 会 为 ALU 在 其 附近 配置 少量 存储 器 ， 以 便 它 存放 最 近 生 成 的 中 间 计 算 结果 。 
例如 ， 在 (A-B) ，C 的 计算 过 程 中 ， 它 可 能 会 将 4+8 的 结果 保存 在 内 存 中 ， 但 随后 与 C 相 乘 之 时 ， 
还 要 再 次 从 内 存 中 读 出 。 显 然 ， 相 比 ADD 和 MULTIIPLY 两 次 运算 操作 ， 两 次 内 存 访问 占据 了 太 多 
的 时 间 。 于 是 ， 几 乎 所 有 的 计算 机 都 为 ALU 配 备 了 临时 存储 空间 ， 来 存放 4+85 的 结果 ， 以 避免 之 后 
的 乘法 操作 引发 不 必要 的 内 存 访问 。 临 时 存储 器 最 常见 的 设计 方式 就 是 一 组 寄存 器 〈 见 3.4.3 节 ) ， 
其 中 每 个 寄存 器 的 宽度 应 该 与 ALU 处 理 数据 的 宽度 一 致 ， 我 们 说 每 个 寄存 器 存放 了 一 个 字 。 在 LC- 
3 中 ， 有 8 个 这 样 的 寄存 器 (R0,R1,…，R7)， 每 个 的 宽度 是 16-bit。 相 比 之 下 ，SPARC-V9 指 令 集结 
构 则 有 32 个 寄存 器 (RO,R1,…，R31)， 每 个 的 宽度 是 64-bit。 


4.1.3 输入 和 输出 单元 


信息 能 够 被 计算 机 处 理 的 前 提 是 “信息 必须 事先 输入 计算 机 ”。 同 样 ， 信 息 的 处 理 结 果 也 必须 
通过 显示 、 打 印 等 方式 输出 至 计算 机 外 部 ， 我 们 称 相关 的 设备 为 输入 /输出 (Input and Output) 设 
备 。 输 入 /输出 设备 的 种 类 很 多 ， 在 计算 机 术语 中 ， 我 们 通常 称 它们 为 “外 围 设备 ”(peripheral)，。 
”之 所 以 这 么 称呼 ， 是 因为 它们 通常 是 计算 机 的 “附属 设备 ”(accessory)， 即 它们 是 可 有 可 无 的 。 

LC-3 只 提供 了 两 个 基本 的 输入 /输出 设备 ， 其 中 ， 输 入 设备 是 键盘 ， 输 出 设备 是 显示 器 。 

真实 的 计算 机 中 ， 还 包含 很 多 其 他 设备 ， 如 输入 设备 包括 鼠标 、 数 字 扫 描 仪 、 软 盘 等 ， 输 出 
设备 包括 打印 机 、LED 显 示 器 、 磁 盘 等 。 在 早期 ， 计 算 机 输入 和 输出 是 依赖 于 穿孔 卡片 (punched 
card), ， 人 们 通常 要 拖 动 成 箱 的 卡片 ， 但 那个 时 代 已 经 完全 过 去 了 。 


4.1.4 控制 单元 


控制 单元 所 扮演 的 角色 如 同 乐 队 的 指挥 ， 用 它 来 控制 其 他 所 有 单元 之 间 的 协同 工作 。 正 如 后 
面 我 们 将 看 到 的 那样 ， 在 计算 机 程序 的 逐步 执行 过 程 中 ， 它 既 负 责 控制 程序 执行 过 程 的 每 一 步 ， 
又 负责 控制 其 中 每 条 指令 执行 过 程 的 每 一 步 。 

控制 单元 中 有 几 个 特殊 的 寄存 器 ， 一 是 指令 寄存 器 (instruction register) ， 保 存 的 是 正在 被 执 
行 的 那 条 指令 ， 二 是 PC 寄存 器 (Program Counter, PC)， 用 来 指示 下 一 条 待 处 理 的 指令 ， 控 制 单元 
专门 准备 了 这 个 寄存 器 。 由 于 历史 的 原因 ， 该 寄存 器 被 命名 为 “程序 计数 器 ”( 即 PC 寄存 器 )， 但 
它 更 合适 的 称 法 应 该 是 “指令 指针 ” (instruction pointer)， 因 为 该 寄存 器 的 内 容 实 际 上 是 指向 下 一 
条 待 处 理 指令 的 地 址 。 有 趣 的 是 ，Intel 公 司 就 是 这 么 命名 的 (在 Intel 处 理 器 手册 中 ， 该 寄存 器 的 简 
称 为 IP)， 而 这 么 好 的 一 个 命名 ， 却 不 被 其 他 处 理 器 所 采用 。 


4.2 LC-3; 一 台 冯 。 诺 伊 曼 机 器 


为 了 将 第 3 章 的 数据 通路 (如 图 3-33 所 示 ) 以 及 4.1 节 介绍 的 各 种 结构 (structure) 有 机 地 结合 
起 来 ， 并 衔接 在 第 5 章 中 将 展开 的 LC-3 设 计 细 节 ， 本 节 将 概述 LC-3 的 全 貌 ， 并 将 它 与 汉 : 诺 伊 党 模 
型 进行 对 比 。 图 4-3 包 括 了 LC-3 的 完整 数据 通路 (如 图 3-33 所 示 )， 但 删除 了 那些 虽然 已 被 实现 ， 
但 不 属于 冯 : 诺 伊 曼 模型 所 定义 5 个 基本 部 分 的 LC-3 实 现 。 

注意 图 4-3 中 的 两 种 箭头 ， 即 实心 箭头 和 空心 箭头 。 实 心 箭 头 代表 该 通路 中 传送 的 是 数据 (被 
控 对 象 ) ， 空 心 箭头 则 代表 的 是 控制 信号 。 例 如 ，ALU 模 块 有 两 个 16 位 的 数据 输入 和 一 个 输出 结果 ， 
由 于 输入 和 输出 都 是 数据 ， 所 以 它们 的 标示 都 是 实心 箭头 ， 而 信号 ALUK 控 制 着 ALU 模 块 的 运算 类 


日 ” 随 着 时 间 的 迁移 ， 这 种 说 法 也 部 分 过 时 了 ， 如 现在 Sony 公 司 的 DV+VCRL 及 大 部 分 手机 ， 采 用 的 都 是 32 位 
处 理 器 ， 其 性 能 要 求 越 来 越 高 ， 甚 至 采用 双核 或 多 核 芯片 。 一 一 译 者 注 
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型 ， 属 于 控制 信号 ， 所 以 它 的 箭头 标示 是 空心 的 。 









控制 单元 


MDR HRT -A 
信号 (GateMDR) 18 18 
MEM.EN, R.W 
LD.MOR —e[ MDA | 1 [ MAR | 
内 存 
图 4-3 LC-3 一 一 一 个 汉 : 诺 伊 曼 模 型 的 实例 
下 面 描 述 图 4-3 的 各 个 主要 组 成 部 分 : 


* HÄ (MEMORY). 包括 存储 单元 ， 以 及 MAR 和 MDR 寄 存 器 。 其 中 ，MAR 是 16 位 宽度 ， 意 
味 着 LC-3 的 最 大 可 寻 址 空间 是 2“*。MDR 也 是 16 位 ， 意 味 着 每 个 存储 单元 存储 了 16 个 bit 的 信 
息 ， 或 称 LC-3 是 16 位 可 寻 址 的 〈addressable ) 。 

。 输 入 /输出 : 即 键盘 和 显示 器 。 最 简单 的 键盘 需要 两 个 寄存 器 : 一 是 数据 寄存 器 KBDR， 保 
存 键 人 的 ASCII 码 ， 二 是 状态 寄存 器 KBSR， 保 存 键 盘 敲 击 时 的 状态 信息 。 同 样 ， 最 简单 的 
显示 器 也 需要 两 个 相似 的 寄存 器 : 一 是 数据 寄存 器 DDPR， 保存 将 要 显示 字符 的 ASCIH 码 ， 二 
是 状态 寄存 器 DSR， 保 存 相关 的 状态 信息 。 有 关 这 些 寄存 器 的 细节 ， 将 在 第 8 章 讨论 。 

。 处 理 单元 : 包括 一 个 算术 逻辑 运算 单元 (ALU) 和 8 个 寄存 器 (RO~R7)。 其 中 ，RO~R7 作 为 
临时 寄存 器 ， 用 以 存放 近期 将 被 后 面 指令 使 用 的 操作 数 。 而 LC-3 的 ALU 只 实现 了 一 种 运算 
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操作 (ADD) 和 两 种 逻辑 操作 ( 按 位 AND 和 NOT)。 

。 控 制 单元 ， 包含 所 有 与 信息 处 理 控制 相关 的 结构 。 其 中 最 重要 的 一 个 结构 就 是 有 限 状 态 机 
(Finite State Machine, FSM), 它 控制 着 系统 中 的 所 有 活动 (有 关 “ 有 限 状 态 机 ”, 请 回顾 3.6 节 )。 
运算 或 处 理 操作 是 一 步 一 步 完 成 的 ， 具 体 地 说 ， 是 一 个 接 一 个 时 钟 周期 有 序 操作 的 (clock 
cycle by clock cycle)。 与 有 限 状 态 机 模块 相关 的 输入 /输出 如 图 4-3 所 示 : (1) 时 钟 输入 CLK， 
它 定义 了 每 个 时 钟 周期 持续 的 长 短 ，(2) 指令 寄存 器 下， 是 有 限 状 态 机 的 一 个 重要 输入 。 由 
于 “输入 决定 了 过 程 ”， 所 以 不 同 的 指令 即 意味 着 完全 不 同 的 处 理 流 程 ，(3) 程序 计数 器 PC， 
也 是 有 限 状 态 机 的 另 一 个 重要 输入 ， 它 指向 当前 指令 之 后 下 一 个 要 执行 指令 的 位 置 。 

值得 注意 的 是 ， 有 限 状 态 机 的 所 有 对 外 输出 都 是 空心 箭头 ， 即 它们 都 是 控制 信号 ， 控 制 着 整 

个 计算 机 系统 的 全 程 活动 。 例 如 ， 输 出 信号 ALUK (2 位 ) 控制 着 ALU 当 前 周期 的 操作 选择 (ADD 
或 AND 或 NOT) ， 另 一 个 输出 GateALU， 则 决定 了 ALU 的 输出 在 当前 周期 是 否 输送 至 处 理 器 总 线 。 
附录 C 提 供 了 关于 LC-3 数 据 通路 、 控 制 信号 和 有 限 状 态 机 的 更 详尽 描述 。 
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D. 诺 伊 曼 模型 的 核心 思想 是 ， 程序 和 数据 都 是 以 bit 流 的 方式 存放 在 计算 机 内 存 中 人 S， 程 序 
在 控制 单元 的 控制 下 ， 依 次 完成 指令 的 读 取 和 执行 。 


4.3.1 指令 


指令 是 计算 机 执行 的 最 小 单位 。 指 令 本 身 又 由 操作 码 和 操作 数 两 部 分 组 成 。 操 作 码 表示 该 指 
令 是 做 什么 的 ， 操 作 数 表示 该 次 操作 的 对 象 是 哪些 。 在 第 5 章 中 我 们 将 介绍 ，LC-3 的 指令 长 度 是 16 
位 (一 个 字 长 ) ， 将 这 16 位 从 左 至 右 依次 编号 为 bit[15]~bit[0] ， 那 么 bit[15:12] 代 表 的 就 是 操作 码 
(同时 也 意味 着 该 字段 最 多 可 表达 2 个 操作 类 型 ) ，bit[11:0] 则 对 应 操作 数 的 表示 。 





O 换 句 话说 ， 从 存储 角度 来 看 ， 指 令 和 数据 之 间 没 有 任何 区 别 。 一 一 译 者 注 
O HEX: 为 什么 操作 数 大 多 是 寄存 器 而 不 是 内 存单 元 ? 一 一 译 者 注 
O WES. 如 果 操 作 数 是 指向 内 存 地 址 的 ， 则 该 字段 需要 占用 多 少 位 ? 一 一 译 者 注 








4.3.2 ”指令 周期 


指令 的 处 理 过 程 是 在 控制 单元 的 控制 下 ， 精 确 地 、 一 步 一 步 地 完成 的 。 我 们 称 这 个 执行 的 步骤 
顺序 为 指令 周期 (instruction cycle) ， 其 中 的 每 一 步 称 为 节拍 (phase) 。 一 个 指令 周期 包括 6 个 节拍 ， 
大 多 数 计 算 机 的 节拍 设计 都 如 此 (6 个 节拍 )， 但 不 是 所 有 的 都 如 此 。 稍 后 我 们 将 讨论 这 个 问题 。 

首先 ， 我 们 看 一 下 指令 周期 的 6 个 节拍 ， 即 FETCH ( 取 指 令 )、DECODE ( 译 码 )、EVALUATE 
ADDRESS (地 址 计算 )、FETCH OPERAND ( 取 操 作 数 )、EXECUTE (执行 )、STORE RESULT 
(存放 结果 )。 下 面 将 以 图 4-3 所 示 的 LC-3 数 据 通路 为 背景 ， 详 细 介绍 每 个 节拍 的 操作 细节 。 

1. 取 指 令 

该 节拍 负责 从 内 存 中 读 取 下 一 条 待 执行 的 指令 ， 并 将 其 装 入 控制 单元 的 指令 寄存 器 IR。 顺 便 
回 显 一 下 ， 一 个 计算 机 程序 是 一 组 指令 的 集合 ， 而 其 中 每 条 指令 又 表示 为 一 个 bit 序 列 集合 。 在 
i - 诺 伊 曼 模 型 中 指出 ， 程 序 执行 时 整个 程序 的 所 有 指令 必须 都 已 保存 在 内 存 中 。 所 以 要 获取 下 
一 条 指令 ， 前 提 是 知道 它 在 内 存 中 的 准确 位 置 。 程 序 计数 器 PC 负责 的 就 是 这 个 任务 ， 它 记录 着 下 
一 条 指令 在 内 存 中 的 地 址 。 

FETCH 节 拍 的 具体 工作 描述 如 下 : 

(1) 将 PC 寄存器 的 内 容 装 入 (load) MAR 寄 存 器 。 

(2) 该 地 址 对 应 内 存单 元 的 内 容 〈 即 下 一 条 指令 ) 被 装 和 人 MDR。 

(3) 控制 单元 将 MDR 内 容 装 入 IR 寄 存 器 。 

之 后 ， 指 令 就 进入 译 码 节拍 。 但 是 ， 由 于 当前 指令 周期 完成 之 后 还 将 读 入 下 一 条 指令 ， 我 们 希 
望 此 时 PC 内 容 应 修改 为 是 指向 下 一 条 指令 的 地 址 。 所 以 ， 在 当前 FETCH 节 拍 还 需要 补充 一 个 动作 ， 
即 修改 PC 寄存 器 的 内 容 ， 我 们 称 之 为 “PC 增 量 ”操作 。 这 样 一 来 ， 在 下 一 条 指令 周期 的 FETCH 节 
拍 ， 下 一 个 内 存单 元 中 的 指令 将 被 自动 装 入 IR 寄 存 器 (只 要 当前 指令 不 去 修改 PC 的 内 容 )。 

以 上 所 有 操作 都 在 控制 单元 掌控 之 下 ， 这 如 同 我 们 之 前 的 比喻 : 乐队 的 乐器 都 在 乐队 指挥 的 
掌控 之 下 (虽然 每 个 乐器 是 由 具体 的 演奏 者 所 操作 ) 。 乐 队 指 挥 的 每 一 个 动作 (stroke) 代表 一 个 
机 器 周期 (machine cycle) ， 其 中 一 个 机 器 周期 对 应 一 个 时 钟 周期 (clock cycle， 参 见 4.4.1 节 )。 事 
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实 上 ， 我 们 对 机 器 周期 和 时 钟 周期 这 两 个 概念 并 不 做 严格 区 分 。 

分 析 如 上 操作 : 第 一 步 MAR 内 容 装载 (load) 将 花费 1 个 机 器 周期 ， 第 二 步 内 存 访 问 则 花费 1 
个 或 更 多 的 机 器 周期 ， 因 为 它 取决 于 计算 机 内 存 访问 的 速度 ， 第 三 步 MDR 和 IR 的 内 容 拷 贝 只 需 1 个 
机 器 周期 。 一 个 机 器 周期 具体 是 多 长 时 间 呢 ? 对 于 现代 计算 机 来 说 ， 这 个 时 间 “ 极 其 短 ”， 对 于 主 
频 为 3.3GHz 的 奔腾 IV 处 理 器 ， 每 秒 将 完成 33 亿 (3.3billion) 机 器 周期 (或 时 钟 周 期 ) ， 即 每 个 机 器 
周期 的 时 间 长 度 只 有 0.303ns (nanosecond) 。 对 比 一 下 ， 你 头顶 的 灯泡 正在 以 每 秒 60 次 的 速率 闪烁 
着 95， 这 意味 着 灯泡 闪烁 一 次 的 瞬间 ， 计 算 机 已 完成 了 5 500 万 次 机 器 周期 ! 

2. 译 码 

译 码 操作 的 任务 是 分 析 、 检 查 指令 的 类 型 ， 并 确定 对 应 的 微 结构 操作 细节 。 如 第 3 章 所 述 ， 
LC-3 采 用 “4-16” 译 码 器 识别 16 种 不 同 指令 ， 也 就 是 以 IR[15:12] 的 4 位 操作 码 字 段 为 输入 ， 输 出 16 
根 使 能 线 ， 但 任何 时 候 16 根 使 能 线 中 有 和 且 仅 有 一 根 是 有 效 的 (对 应 16 种 不 同 指令 )。 同 时 ， 基 于 不 
同 的 使 能 线 ， 剩 余 的 12bit 指 令 信息 的 解释 含义 也 有 所 不 同 。 

3. 地 址 计算 

如 果 指 令 执行 时 存在 地 址 计算 操作 ， 则 在 此 节拍 完成 。 以 例 4-2 的 LDR 指 令 为 例 ，LDR 指 令 应 
将 特定 地 址 内 存单 元 的 内 容 读 入 寄存 器 R3， 则 地 址 值 应 该 等 于 R3 内 容 和 立即 数 6 之 和 ， 该 求 和 操作 
就 是 在 地 址 计算 (EVALUATE ADDRESS) 节拍 完成 的 。 

4. 取 操 作 数 

该 节拍 负责 读 取 指 令 处 理 所 需 要 的 源 操 作 数 。 仍 以 LDR 指 令 为 例 ， 该 节拍 包括 两 个 子 步骤 : (1) 将 
之 前 地 址 计算 节拍 算出 的 地 址 值 装 入 MAR 寄 存 器 ，(2) 从 MDR 寄 存 器 获取 读 自 内 存 的 源 操 作 数 。 

再 以 例 4-1 的 ADD 指 令 为 例 ， 该 指令 的 源 操作 数 分 别 来 自 R2 和 R6 寄 存 器 ， 它 们 全 部 来 自 寄存 器 
而 没有 内 存 操作 。 顺 便 提 一 下 ， 在 当前 的 大 多 数 微 处 理 器 中 ， 该 节拍 可 以 和 指令 译 码 节拍 同时 执行 ， 
这 类 指令 的 加 速 处 理 技巧 是 个 相当 吸引 人 的 话题 ， 但 受制 于 篇 幅 和 本 书 层次 ， 我 们 不 在 此 展开 讨论 。 

5. 执行 

该 节拍 负责 指令 的 执行 操作 ， 不 同 的 操作 码 在 该 节拍 的 操作 也 多 半 不 同 。 如 ADD 指 令 ， 本 节 
拍 在 ALU 中 执行 的 就 是 一 个 单 拍 加 法 操作 。 

6. 存放 结果 

这 是 指令 执行 的 最 后 节拍 。 来 自 之 前 节拍 的 执行 结果 将 被 写 人 目的 寄存 器 。 

在 最 后 一 个 节拍 (STORE RESULT) 完成 之 后 ， 控 制 单元 复位 指令 周期 ， 即 从 “ 取 指 令 ” 节 
拍 重 新 开始 。PC 寄 存 器 在 上 个 指令 周期 已 自动 修改 ， 即 已 指向 下 一 条 指令 所 在 的 地 址 。 由 于 前 后 
指令 在 存储 空间 上 的 存放 是 顺序 的 ， 因 而 我 们 又 称 计算 机 的 执行 方式 是 “顺序 执行 ”， 如 此 执行 ， 
直到 该 顺序 流 (sequential flow) 被 打 断 。 





日 ”美国 的 交流 电 频 率 是 60Hz， 而 中 国 的 是 50Hz。 一 一 译 者 注 
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4.4 改变 执行 顺序 

之 前 我 们 所 描述 的 都 是 顺序 的 程序 执行 过 程 ， 即 第 一 条 指令 执行 之 后 ， 接 着 就 是 执行 第 二 条 
指令 ， 随 后 就 是 第 三 条 ， 如 此 继续 。 其 中 包含 的 指令 类 型 也 仅 有 两 种 ， 即 运算 指令 (operate 
instruction). 和 数据 搬移 指令 (data movement instruction) 。 如 ADD 指 令 属于 操作 类 指令 ，LDR 指 
令 则 属于 数据 搬移 类 指令 (即将 数据 从 一 个 地 方 搬 到 另 一 个 地 方 )。 当 然 有 些 指令 ， 它 们 既是 操作 
类 也 是 数据 搬移 类 的 (在 第 5 章 有 关 LC-3 的 介绍 中 ， 你 会 发 现 这 样 的 指令 )。 

下 面 介绍 第 三 类 指令 ， 即 控制 指令 (control instruction)， 其 作用 是 改变 程序 的 执行 顺序 。 例 
如 ， 如 果 我 们 希望 循环 反复 地 执行 一 组 指令 ， 即 先是 第 1 条 、 第 2 条 、 第 3 条 地 执行 一 遍 ， 然 后 回 过 
头 来 ， 第 二 遍 再 次 执行 第 1、2、3 条 指令 ， 再 然后 是 第 3 遍 ， 如 此 反复 。 如 我 们 所 知 ， 任 意 的 指令 
周期 都 是 从 将 PC 的 内 容 装载 到 MAR 开 始 的 ， 因 而 ， 如 果 我 们 希望 改变 指令 执行 的 顺序 ， 就 必须 在 
一 条 指令 的 取 指 令 节 拍 ， 即 把 PC 加 1 操作 之 后 与 下 一 条 指令 的 取 指 令 节拍 开始 之 前 的 这 段 期 间 内 ， 
修改 程序 计数 器 PC 的 值 。 控 制 指令 即 在 指令 的 执行 节拍 来 修改 PC 的 内 容 ， 覆 盖 之 前 取 指 令 节拍 时 
PC 加 1 后 的 值 。 该 控制 指令 执行 完成 后 ， 在 下 一 个 指令 周期 开始 时 ， 计 算 机 访问 PC 获得 的 地 址 值 ， 
是 由 该 控制 指令 在 执行 节拍 换 入 的 新 地 址 值 ， 而 不 是 之 前 PC 加 1 后 的 地 址 值 ， 从 而 实现 了 改变 程序 
的 执行 顺序 的 目的 。 





指令 周期 的 控制 


之 前 我 们 介绍 过 ， 一 个 指令 周期 包括 6 个 节拍 (phase)， 而 每 个 节拍 又 分 解 为 若干 个 子 步 又 
(step) 。 如 取 指 令 节 拍 (FETCH) ， 它 需要 三 个 步 又 舌 序 执行 〈 而 不 可 并 行 ) 才能 完成 ， 一 是 将 PC 
内 容 装 入 MAR 寄 存 器 ， 二 是 读 内 存 ， 三 是 将 MDR 寄 存 器 内 容 装 入 IR 寄 存 器 。 所 有 这 些 取 指令 节拍 
的 子 步 骤 ， 完 全 受 控 于 控制 单元 中 的 有 限 状 态 机 。 l 


日 ”本 书 作 者 表示 十 六 进 制 数 的 方式 是 省 略 前 绎 “0”， 如 写成 “x36A2” 而 不 是 “0x36A2”。 一 一 译 者 注 
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图 4-4 所 示 是 一 个 有 了 腿 状态 机 的 状态 转移 简 图 ， 显 示 的 是 状态 机 在 一 个 指令 周期 内 名 个 节拍 的 


状态 。 如 3.6 布 介绍 的 有 限 状 态 机 示例 ， 每 个 状态 对 应 一 个 时 钟 周期 内 的 活动 ， 每 个 状态 (或 节点 ) 
的 具体 操作 行为 如 节点 方 框 内 所 描述 ， 连 接线 表示 从 一 个 状态 至 下 一 状态 的 迁移 。 


状态 1 
MAR< 一 PC 
PC< 一 PC + Í 
MDR«-M[MAR] 








取 指 令 节拍 (FETCH ) 










LDR 指 令 在 
DECODE 节 拍 后 执 
行 的 第 一 个 状态 






ADD 指 令 执 行 过 m LDR 指 令 执 行 过 程 


程 的 最 后 一 个 状态 的 最 后 一 个 状态 





到 状态 1 到 状态 1 到 状态 1 
图 4-4 LC-3 有 限 状 态 机 简 图 


取 指 令 节 拍 需 要 3 个 时 钟 周 期 : 

(1) 有 限 状态 机 的 起 始 状 态 是 “状态 1”， 也 是 指令 周期 的 第 1 个 时 钟 。 本 周期 内 将 同时 完成 
“将 PC 内 容 装 入 MAR” 和 “PC 自动 增 量 ”两 个 操作 。 操 作 一 : 为 将 PC 内 容 装 和 人 MAR 寄存 器 (如 图 
4-3 所 示 )， 有 限 状 态 机 必须 控制 GatePC 和 LD.MAR 两 个 信号 。GatePC 控 制 着 PC 与 处 理 器 总 线 
(processor bus) 之 间 的 通路 ，LD.MAR 是 MAR 的 可 写 信 号 ， 它 确保 当前 周期 结束 时 ， 将 总 线 数据 
“ 锁 ” 入 MAR 寄 存 器 ( 锁 存 器 总 是 在 时 钟 周期 结束 时 ， 将 输入 端 数 据 锁 人 )。 操 作 二 : PC 增 量 操作 ， 
如 图 4-3 所 示 ， 有 限 状 态 机 通过 PCMUX 信 号 控制 标示 为 “+1” 的 功能 单元 输出 ， 而 LD.PC 信 号 则 
控制 着 PC 的 输入 (或 是 PCMUX 开 关 单 元 的 输出 )。 昌 

(2) 第 2 个 时 钟 开始 ， 有 限 状 态 机 进入 “状态 2”。 在 这 个 周期 内 完成 “ 读 内 存 ” 操 作 ， 并 将 内 
存 返回 数据 (确切 地 说 ， 这 个 节拍 返回 的 实际 上 是 “指令 ? ) 自动 装 入 MDR。 ` 


日 ”图 中 PCMUX 信 号 的 标示 被 省 略 ，PCMUX 信 和 号 即 指 PCMUX 开 关 单 元 左 侧 的 2 线 输 入 。 一 一 译 者 注 
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(3), 状态 3， 将 MDR 中 的 数据 拷贝 至 指令 寄存 器 (IR)。 有 限 状 态 机 为 此 控制 GateMDR 和 
LD.IR 等 两 个 信号 ， 即 在 周期 结束 时 ， 将 MDR 输 出 锁 入 IR。 至 此 ， 完 成 全 部 取 指令 操作 。 

译 码 节拍 只 需要 1 个 时 钟 周 期 。 

(4) 在 状态 4 中 ， 基 于 IR 寄 存 器 的 输入 ， 尤 其 是 该 指令 的 操作 码 部 分 (IR[15:12])， 有 限 状 态 
机 的 转移 出 现 不 同 的 分 支 去 向 。 

之 后 ， 有 限 状 态 机 继续 ， 直 到 整个 指令 完成 ， 并 最 后 返回 到 状态 1。 我 们 称 这 个 过 程 为 “状态 
转移 ”。 不 同 指令 之 间 的 差异 ， 主 要 体现 在 取 指 令 和 译 码 节 拍 之 后 的 这 些 操 作 上 ， 它 们 的 实现 是 不 
同 的 。 

有 了 时 候 我 们 希望 跳 到 别 的 地 方 去 获取 下 一 条 要 执行 的 指令 (而 不 是 空间 顺序 上 的 下 一 条 )， 我 
们 称 这 种 能 够 改变 程序 执行 顺序 的 指令 为 “控制 指令 *。 控 制 指令 的 实现 机 制 非常 简单 ， 即 在 执行 
节拍 修改 PC 内 容 即 可 ， 如 图 4-4 中 的 状态 63 所 示 。 

附录 C 详 细 描 述 了 LC-3 的 设计 实现 , 其 中 包括 了 完整 的 状态 图 和 数据 通路 。 而 本 章 将 不 深 和 人 细节 ， 
我 们 此 时 的 目标 只 是 想 告诉 你 ， 指 令 周 期 级 的 处 理 并 非 那么 神奇 ， 完 整 的 状态 图 描述 应 该 是 时 钟 级 
别 的 ， 能 够 控制 整个 指令 周期 中 每 一 个 节拍 的 动作 。 由 于 每 个 指令 周期 结束 后 ， 都 返回 到 “状态 ! ， 
由 此 可 以 推论 ， 通 过 一 个 周期 接 一 个 周期 的 操作 ， 最 终 可 以 完成 整个 程序 ( 即 指令 集合 ) 的 执行 。 





运行 控制 位 
a) b) 
图 4-5 时 钟 电路 及 其 控制 部 件 


4.5 停机 操作 


之 前 所 描述 的 一 切 ， 都 给 我 们 这 样 一 种 感觉 ， 即 计算 机 好 像 永 远 不 会 停止 ! 因为 它 会 不 停 地 
要 求 “ 获 取 下 一 条 指令 ”， 然 后 一 个 周期 接 一 个 周期 地 执行 ， 真 令 人 无 法 忍受 ! 计算 机 是 永 不 疲劳 
的 ， 难 道 它 非得 这 样 永远 运行 下 去 ， 直 到 有 人 拔 了 它 的 电源 插头 才能 停止 ? 

对 于 用 户 程 序 来 说 ， 它 通常 是 受 控 于 操作 系统 而 执行 的 ， 如 UNIX、DOS、MacOS 或 Windows 
NT 等 ， 都 属于 操作 系统 ， 即 操作 系统 有 办 法 终止 一 个 用 户 程序 的 和 运行。 但 是 ， 操 作 系 统 本 身 也 是 
一 个 计算 机 程序 。 另 外 ， 对 于 计算 机 来 说 ， 用 户 程序 和 操作 系统 程序 两 者 之 间 并 没有 区 别 。 即 它 
们 都 是 一 堆 指 令 的 集合 ， 计 算 机 要 做 的 事情 ， 就 是 一 条 指令 接 一 条 指令 地 执行 。 

总 之 ,程序 的 停止 问题 对 于 用 户 程序 来 说 很 好 办 ， 只 需要 在 用 户 程 序 的 结束 处 “ 埋 放 ”一 条 
控制 指令 ， 访 控制 指令 的 任务 就 是 修改 PC 寄存 器 ， 使 之 跳 回 操作 系统 ， 而 操作 系统 通常 也 将 借助 
这 个 时 刻 启 动 一 个 新 的 用 户 程 序 。 

但 是 ， 从 指令 层次 来 看 ， 计 算 机 仍然 是 “永远 动 着 的 ”( 要 么 是 执行 用 户 程 序 ， 要 么 是 执行 操 
作 系 统 的 指令 )。 如 果 我 们 希望 停止 这 个 无 穷 的 指令 周期 序列 ， 该 怎么 做 昵 ? 再 以 乐队 演奏 为 例 ， 
计算 机 的 运行 相当 于 指挥 棒 在 以 每 秒 百 万 次 的 速率 挥动 ， 停 止 乐 队 演 奏 的 关键 是 停止 指挥 棒 。 那 
么 谁 是 计算 机 中 的 “指挥 棒 ” 呢 ? 答案 是 “时 钟 ”(clock) 。 时 钟 就 是 机 器 周期 ， 一 个 机 器 周期 的 
开始 ， 在 当前 节拍 中 意味 着 下 一 个 操作 步骤 (next step) 的 开始 ， 或 在 当前 指令 周期 中 意味 着 下 一 
节拍 的 开始 。 因 而 ， 终 止 了 时 钟 ， 就 意味 着 终止 了 指令 的 执行 ! 

时 钟 电 路 的 结构 如 图 4-5a 所 示 ， 主 要 包括 时 钟 信 号 发 生 器 (clock generator) 和 RUN 状 态 开 
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X95, Hm. 

(1) 时 钟 信号 发 生 器 的 主要 部 件 是 晶体 振荡 器 (crystal oscillator， 简 称 “晶振 ”") ， 它 是 一 种 压 电 
类 设备 (piezoelectric device), ， 即 输入 “ 电 ”， 就 能 转换 出 “压力 ”( 产 生 振荡 )。 我 们 只 需要 将 “ 晶 
振 ” 理 解 为 一 个 能 够 产生 振荡 电压 (如 图 4-5b 所 示 ) 的 黑箱 (参见 1.4 节 之 “黑箱 ”定义 )， 这 个 振荡 
电压 就 等 价 于 指挥 手中 的 指挥 棒 ， 在 一 个 机 器 周期 中 ， 前 半 周 电压 保持 为 2.9V， 后 半 周 落 至 0V。 

(2) RUN 锁 存 器 的 状态 或 输出 如 果 是 1 ( 即 0=1)， 则 时 钟 电路 的 输出 和 时 钟 信号 发 生 器 的 输 
出 一 致 (透明 输出 ) ， 如 果 RUN 部 件 的 输出 是 0 (C=0) ， 则 时 钟 信号 发 生 器 到 时 钟 电路 的 通路 被 
切断 ， 即 时 钟 电路 输出 为 0。 

因此 ， 如 果 要 终止 指令 周期 ， 只 需 “ 清 零 ”RUN 状 态 即 可 。 每 个 计算 机 都 具备 类 似 的 机 制 ， 
在 一 些 老 机 器 上 ， 还 提供 了 HALT 指 令 来 完成 这 个 功能 。LC-3 的 做 法， 如 同 大 多 数 机 器 一 样 ， 是 由 
操作 系统 控制 完成 的 (参考 第 9 章 )。 

思考 题 : 如 果 HALI 指 令 能 够 清 霉 RUN 锁 存 器 ， 则 停止 指令 时 钟 。 那 么 设计 一 个 什么 样 的 指令 ， 
能 够 通过 设置 RUN 锁 存 器 重启 指令 周期 呢 ? 


4.6 习题 


41 KHB- 庄 伊 曼 模 型 的 5 个 组 成 部 分 ， 并 写 出 各 个 部 件 的 功能 和 目的 。 

4.2 简要 描述 一 下 内 存 和 处 理 单元 的 接口 ， 即 内 存 和 处 理 单元 的 通信 方式 。 

43 程序 计数 器 (PC) 的 命名 可 能 存在 什么 误导 ?为 什么 说 指令 指针 (Instruction Pointer, IP) 的 
命名 更 加 合适 ? 

4.4 请 解释 一 个 计算 机 的 “ 字 长 ”(word length) 的 定义 。 字 长 对 计算 机 的 工作 有 什么 影响 ? 基于 
第 1 章 中 的 知识 ， 试 判断 以 下 论断 是 否 正确 : 字 的 长 度 越 大 ， 处 理 的 信息 越 多 ， 因 而 计算 能 


DOLER, 
4.5 如 下 表格 代表 的 是 一 个 很 小 的 内 存 。 请 基于 以 下 表格 回答 问题 。 
地 oon 数 a 

0000 0001 1110 0100 0011 
0001 1111 0000 0010 0101 
0010 0110 1111 0000 0001 
0011 0000 0000 0000 0000 
0100 0000 0000 0110 0101 
0101 0000 0000 0000 0110 
0110 1111 1110 1101 0011 
0111 0000 0110 1101 1001 


a. 地 址 为 3 的 内 存单 元 存放 的 数值 是 多 少 ? 地 址 6 呢 ? 
b. 每 个 地 址 单元 的 二 进 制 码 数值 可 以 有 多 种 解释 方法 。 之 前 我 们 学 过 ， 它 可 以 是 一 个 无 符号 
数 、 有 符号 补 码 或 是 浮 点 数 等 。 
1) 分 别 写 出 地 址 9 和 地 址 1 数值 所 对 应 的 补 码 数 ， 
2) 写 出 地 址 4 对 应 的 ASCII 码 ， 
3) 写 出 地 址 6 和 7 对 应 的 IEEE 浮 点 数值 (6 和 7 合 起 来 ， 表 示 一 个 32 位 浮 点 数 ) ， 
4) 分 别 写 出 地 址 0 和 地 址 1 对 应 的 无 符号 整数 值 。 
c. EB- 诺 伊 曼 模 型 中 ， 一 个 内 存单 元 中 的 数值 既 可 能 代表 数据 也 可 能 代表 指令 ， 如 果 将 地 


日 RUN 状 态 开关 ， 原 文 为 “RUN latch”， 表 示 它 的 实现 方式 是 一 个 单 bit 锁 存 器 ， 可 置 位 (set) REF 


(clear), 译 者 注 
如 ”这 里 说 到 的 “能 力 ” 是 指 所 能 做 的 事情 ， 而 不 是 计算 速度 。 一 一 译 者 注 
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址 0 的 内 容 看 做 是 一 条 指令 ， 问 该 指令 是 什么 (LC-3) ? 

d. 一 个 二 进 制 数 还 可 以 表示 为 一 个 内 存 地 址 。 假 设 地 址 5 单元 存放 的 是 一 个 内 存 地 址 ， 那 么 它 
指向 的 单元 地 址 是 多 少 ? 该 地 址 中 存放 的 数值 又 是 多 少 ? 

一 条 指令 有 哪 两 个 主要 的 组 成 部 分 ? 试 简 述 这 两 个 组 成 部 分 的 内 容 和 作用 。 

假设 一 个 32 位 指令 的 格式 如 下 : 


如 果 存 在 60 种 操作 码 和 32 个 寄存 器 ,试问 立即 数 部 分 (IMM) 可 表达 的 范围 是 多 大 


(IMM 的 编码 方式 为 补 码 ) ? 
假设 一 个 32 位 指令 的 格式 如 下 : 


OPCODE | DR | SRI SR2 UNUSED 


如 果 操 作 码 的 数目 是 225， 寄 存 器 数目 是 120， 试 问 ; 
a. 指令 中 表达 操作 码 部 分 所 需要 的 最 小 位 数 是 多 少 ? 
b. 表达 目的 寄存 器 的 最 小 位 数 是 多 少 ? 
c. 表达 UNUSED 部 分 可 用 的 最 大 位 数 是 多 少 ? 
指令 周期 中 取 指 令 节 拍 要 完成 两 件 重要 任务 ， 其 一 是 将 下 面 要 处 理 的 指令 读 入 指令 寄存 器 ， 
试问 另 一 个 任务 是 什么 ? — 
例 4-1、4-2 和 4-5 分 别 描述 了 ADD、LDR、JMP 三 个 指令 的 处 理 过 程 。 在 整个 指令 周期 中 ， 
对 于 不 同 的 指令 ， 在 不 同 的 节拍 会 对 寄存 器 PC、IR、MAR 和 MDR 做 出 不 同 的 修改 ， 请 填写 
TR (在 空格 中 填 和 人 对 应 的 指令 操作 码 )。 

取 指 令 译 码 取 数 据 计算 机 地 址 执行 存放 结果 





说 明 指 令 周 期 的 各 个 节拍 ， 并 简 述 各 节拍 中 发 生 的 各 种 操作 。 

以 ADD、LDR、JMP 指 令 为 例 ， 分 别 写 出 它们 的 指令 周期 中 各 节拍 的 操作 。 

假设 读 、 写 内 存 操作 需要 100 个 周期 ， 而 读 写 寄存 器 和 其 他 节拍 操作 只 需要 1 个 周期 。 试 计算 IA- 
32 指 令 “ADD [eax],edx”( 参 考 例 4-3) 和 LC-3 指 令 “ADD R6,R2,R6” 所 需要 的 执行 周期 数 。 

试 描述 JMP 指 令 的 执行 情况 (假设 R3 内 容 为 x369C， 参 考 例 4-5 )。 

如 果 HALT 指 令 可 以 清除 RUN 锁 存 器 ， 即 停止 指令 周期 。 试问 什么 指令 可 以 设置 RUN 锁 存 器 ， 
即 重新 启动 指令 周期 ? 

a. 假设 机 器 周期 的 长 度 是 2ns ( 即 2 x 10" 秒 ) ， 问 每 秒 钟 能 产生 多 少 个 机 器 周期 ? 

b. 如 果 平均 每 条 指令 需要 8 个 周期 ， 且 计算 机 每 次 处 理 一 条 指令 ， 问 该 计算 机 每 秒 能 处 理 多 
少 条 指令 ? 

c. 为 提高 计算 机 每 秒 执行 指令 的 数目 ， 现 代 计 算 机 中 采用 了 很 多 方法 。 方 法 之 一 是 类 似 生 产 流 
水 线 (或 装配 线 ) 的 方法 ， 即 指令 的 每 个 节拍 都 被 分 割 成 相对 独立 的 一 个 或 多 个 逻辑 部 件 ， 每 
个 节拍 接着 上 一 个 节拍 (同时 也 是 上 一 个 周期 ) 的 工作 继续 做 。 基 于 这 种 模式 ， 每 个 机 器 周期 
都 可 以 从 内 存 读 入 一 条 新 指令 ， 然 后 在 取 指令 周期 结束 时 ， 将 其 传递 给 后 面 的 译 码 节拍 ， 而 在 
下 一 个 机 器 周期 中 ， 该 指令 在 被 译 码 的 同时 ， 下 一 条 指令 又 可 以 被 读 和 信 。 这 就 是 所 谓 的 “装配 
线 ”(assembly line)。 假 设 指令 是 有 序 地 存放 在 内 存 中 的 ， 且 没有 任何 事情 打 断 这 个 顺序 执行 ， 
那么 这 个 “装配 线 ” 每 秒 钟 能 执行 多 少 条 指令 ? (在 以 后 的 高 级 课程 中 ， 在 专业 上 称 这 种 装配 
线 为 “流水 线 一 -pipeline”， 届 时 还 将 研究 是 什么 原因 使 得 流水 线 不 能 顺利 “流动 ”。) 


第 5 章 LC-3 结 构 


在 第 4 章 中 ， 我 们 讨论 了 计算 机 的 基本 组 成 ， 它 由 以 下 单元 组 成 :(1) 内 存 ，(2) 处 理 单元 及 
相关 的 临时 存储 (通常 指 寄存 器 组 ) ; G) 输入 输出 设备 ，(4) 控制 所 有 单元 活动 的 控制 单元 
(包括 控制 单元 本 身 ) 。 另 外 ， 我 们 还 学 习 了 指令 周期 的 6 个 节拍 ; FETCH ( 取 指 令 )、DECODE 
( 译 码 )、ADDRESS EVALUATION (地 址 计算 )、OPERAND FETCH ( 取 操 作 数 )、EXECUTE 
(执行 )、STORE RESULT (存放 结果 )。 下 面 我 们 将 介绍 一 个 “真实 的 ”计算 机 LC-3， 更 确切 地 说 ， 
是 介绍 LC-3 的 指令 集结 构 (ISA)。 之 前 你 应 该 已 听 到 我 们 不 停 地 提 到 LC-3 以 及 它 的 部 分 指令 ， 下 
面 将 对 它 进 行 更 系统 的 描述 。 

在 第 1 章 中 ， 我 们 描述 了 这 样 一 个 概念 ， 即 ISA 是 软件 命令 和 硬件 执行 体 之 间 的 接口 。 在 本 章 
以 及 第 8、9 章 中 ， 我 们 将 以 LC-3 为 描述 对 象 ， 重 点 讲述 ISA 的 重要 作用 和 特性 ， 你 在 使 用 LC-3 自 
己 的 语言 ( 即 LC-3 机 器 语言 ) 编写 程序 时 ， 将 用 到 这 些 重要 特性 。 

有 关 LC-3 ISA 的 详细 描述 ， 请 参考 附录 A。 


5.1 1ISA 概 述 


ISA 定 义 了 软件 编程 所 需要 的 必要 而 完整 的 描述 。 换 名 话说 ，ISA 向 以 机 器 语言 编程 的 程序 员 
提供 有 关 控 制 机 器 所 需要 的 所 有 必要 人 信息。 另外， 面向 专业 的 系统 编程 ITSA 还 将 定义 更 详细 的 机 器 
相关 信息 。 如 高 级 语言 (如 C、Pascal、Fortran、COBOL) 编译 器 的 开发 者 需要 知道 一 些 “ 容 门 ”， 
才能 将 高 级 语言 翻译 成 高 效 的 机 器 语言 。 

ISA 给 出 了 内 存 组 织 方式 、 寄 存 器 组 、 指 令 集 (包括 操作 码 、 数 据 类 型 、 寻 址 模式 ) 等 信息 。 


5.1.1 内 存 组 织 


LC-3 的 可 寻 址 空间 大 小 是 2 (或 65536) ， 寻 址 ( 即 读 写 ) 基本 单位 是 16 位 。65536 大 小 的 空 
间 并 不 是 全 部 用 于 内 存 ， 在 第 8 章 中 将 讨论 这 个 问题 。 由 于 LC-3 中 数据 处 理 的 基本 单位 是 16 位 ， 所 
以 我 们 在 此 称 这 16 位 为 一 个 “ 字 ”(word)， 同 时 我 们 也 称 LC-3 是 一 个 “ 字 寻 ? 址 ”(word- 
addressable) 机 器 。 


5.1.2 寄存 器 


由 于 从 内 存 中 获取 数据 的 速度 很 慢 (不 止 一 个 周期 )， 所 以 LC-3 和 大 多 数 的 机 器 一 样 ， 还 提供 
了 临时 存储 空间 ， 它 们 的 访问 速度 是 一 个 周期 。 临 时 存储 空间 的 最 常见 实现 方式 是 寄存 器 ，LC-3 
中 提供 了 一 组 通用 寄存 器 ， 其 中 的 每 个 寄存 器 称 为 通用 寄存 器 (General Purpose Register, GPR), 

寄存 器 和 内 存 的 特性 是 一 样 的 : i 

(1) 记忆 特性 。 即 可 以 存储 信息 并 可 被 再 次 读 出 。 每 个 寄存 器 的 存储 大 小 是 一 个 “ 字 ”, 在 
LC-3 中 即 为 16 位 。 

(2) 独立 寻 址 。 每 个 寄存 器 必须 有 独立 的 惟一 标识 。LC-3 中 提供 了 8 个 GPR ( 即 意味 着 标识 编 
号 需要 3 位 就 足够 了 ) ， 用 符号 表示 的 话 ， 就 是 R0，R1，…，R7， 图 $-1 所 示 是 LC-3 寄 存 器 组 ， 有 
时 我 们 又 称 之 为 寄存 器 文件 ， 其 中 RO，…，R7 的 内 容 分 别 为 1、3、5、7、-2、-4、-6 和 -8。 

如 下 是 一 条 ADD 指 令 ， 其 含义 是 将 RO 和 R1 的 内 容 相 加 ， 然 后 存 人 R2。 


78 #5# 


15 14 13 12 ll 10 9 8 7 6 5 4 3 2 1 0 
ol o e e o e o ee 
ADD R2 RO R1 

其 中 ADD 指 令 的 两 个 源 操 作 数 分 别 由 bit[8:6] 和 bitf2:0] 表 示 ， 即 R0 和 R1，ADD 运 算 结 果 存 放 
的 目的 寄存 器 由 bit[11:9] 表 示 ， 即 R2。 图 5-2 所 示 的 是 ADD 运 算 之 后 寄存 器 文件 的 内 容 (对 比 图 5-1， 


注意 其 变化 )。 









Register — (RO) Register 0 
















Registerl (R1) Register 1 
Register2 (R2) Register 2 
Register3 (R3) Register 3 
Registerd — (R4) Register 4 
Register$ — (R5) Register 5 
Register6 (R6) Register 6 
Register7 (R7) Register 7 
图 5-1 ADD 指 令 执行 前 的 寄存 器 文件 图 5-2 ADD 指 令 执 行 之 后 的 寄存 器 文件 


5.1.3 指令 集 


一 条 指令 分 为 两 个 部 分 : 操作 码 (做 什么 ) 和 操作 数 (对 谁 操作 )。 一 个 ISA (或 体系 结构 ) 
的 指令 集 (instruction set) 定义 包括 : 操作 码 的 集 含 、 数 据 类 型 和 寻 址 模式 。 其 中 寻 址 模式 决定 了 
操作 数 的 存放 位 置 。 

在 刚才 的 例子 中 我 们 看 到 ， 其 操作 码 是 ADD， 寻 址 模式 是 “寄存 器 模式 ”(register mode), $R 
作 码 ADD 的 意思 是 请 求 计算 机 执行 补 码 加 法 ， 而 被 操作 对 象 (或 数据 ) 则 来 自 通用 寄存 器 。 


5.1.4 操作 码 


有 的 ISA 拥 有 一 个 庞大 的 指令 操作 码 集 合 ， 其 中 每 一 个 操作 码 对 应 了 计算 机 的 各 种 功能 之 一 ， 
而 有 的 ISA 的 操作 码 集合 却 很 小 。 有 些 ISA 具 备 特殊 科学 计算 能 力 〈 即 操作 码 ) ， 例 如 惠普 公司 的 
Precision Architecture 具 有 一 条 同时 操作 三 个 参数 并 完成 乘 /加 混合 操作 的 指令 (4 x B+C) ; 还 有 的 
计算 机 具备 图 像 /图 片 处 理 专用 的 指令 ， 如 Intel 公 司 的 MMX (Multi-Media eXtend) 指令 (常规 x86 
指令 集 的 扩展 )。 另 外 ， 大 多 数 ISA 还 包括 操作 系统 相关 指令 ， 如 VAX 结 构 (20 世 纪 80 年 代 的 主流 
机 型 ) 就 具备 保存 程序 信息 的 专用 指令 (用 于 操作 系统 切换 用 户 程 序 之 用 )。 有 趣 的 是 ， 现 在 的 大 
多 数 计算 机 GEISA) 通常 却 使 用 一 长 串 的 指令 来 完成 信息 保存 工作 (而 不 是 一 条 指令 )， 这 看 起 
来 有 些 “ 倒 退 ”? 这 其 中 是 有 道理 的 ， 有 关 的 话题 可 能 要 在 以 后 的 课程 里 才能 解释 清楚 。 究 竟 哪 
些 指 令 要 丢弃 、 哪 些 指 令 要 添加 ， 一 直 是 体系 结构 设计 过 程 中 和 争议 最 激烈 的 话题 ， 因 为 要 考虑 的 
因素 很 多 ! 

LC-3 的 ISA 结 构 定义 了 15 条 指令 ， 每 条 指令 对 应 一 个 操作 码 (指令 的 pit[15:12])。 细 心 的 读者 
可 能 注意 到 ，4 个 bit 的 操作 码 字 段 可 以 定义 16 种 指令 。 在 LC-3 中 ， 操 作 码 值 1101 没 有 定义 ， 我 们 将 
其 预 留 (以 后 再 定义 )。 

所 有 指令 可 以 分 为 三 类 : 运算 (operate)、 数 据 搬移 (data movement) 和 控制 (control) 。 运 
算 类 指令 负责 处 理 信息 ， 数 据 搬 移 类 指令 则 负责 在 内 存 和 寄存 器 之 间 以 及 内 存 /寄存 器 和 输入 /输出 
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设备 之 问 转移 信息 ， 控 制 类 指令 负责 改变 指令 执行 的 顺序 ， 即 它们 能 让 程序 随时 跳 转 至 另 一 个 地 


方 继续 执行 (而 不 是 常规 的 顺序 向 下 执行 )。 
图 5-3 列 出 了 LC-3 的 所 有 指令 及 其 格式 ， 其 中 bit[15:12] 标 识 了 各 种 对 应 的 操作 码 。 有 关 各 种 格 


式 的 使 用 ， 将 在 5.2、5.3、5.4 节 详细 阐述 。 
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图 5-3 LC-3 指 令 集 (全 部 ) 的 格式 。 注 意 ，+ 表 示 该 指令 将 改变 条 件 码 
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5.1.5 数据 类 型 

数据 类 型 是 指 信息 的 表达 方式 ， 即 意味 着 ISA 的 操作 码 是 怎样 理解 这 些 表 达 信息 的 。 计 算 机 表 
达 同 一 个 信息 的 方式 有 很 多 种 ， 这 一 点 我 们 应 该 不 会 惊奇 ， 生 活 中 有 很 多 类 似 的 例子 。 例 如 ， 对 
一 个 孩子 来 说 ， 我 们 间 他 有 几 风 时， 他 伸 出 三 个 指头 ， 但 他 也 可 能 像 个 大 人 一 样 ， 在 纸 上 写 一 个 
数字 “3”， 而 对 于 CS 或 CE 专业 的 大 学 生 ， 他 可 能 会 写成 “0000000000000011”， 即 数字 3 的 16 位 
二 进 制 编码 ， 化 学 专业 的 学 生 可 能 会 写成 “3.0 x 10"”。 这 四 种 方式 表达 了 同一 个 信息 实体 ，3。 

如 果 ISA 的 操作 码 能 识别 /处 理 某 种 数据 类 型 表示 的 信息 ， 我 们 称 该 SA 支持 这 种 数据 类 型 。 第 
2 章 中 ， 我 们 介绍 了 LC-3 的 ISA 所 支持 的 惟一 数据 类 型 : 补 码 整数 。 


5.11.6 寻 址 模式 


寻 扯 模式 是 指定 义 操作 数位 置 (或 来 源 ) 的 一 种 机 制 。 操 作 数 可 能 存在 的 地 方 无 非 是 以 下 三 种 
之 一 : 内 存 、 寄 存 器 或 指令 本 身 。 其 中 ， 我 们 称 存在 于 指令 之 中 的 操作 数 为 “字面 值 ”(literal) 或 
“立即 数 ”(immediate)。“ 字 面值 ”说 法 是 指 该 操作 数 是 由 指令 的 bit 从 字面 上 组 成 的 ， 而 “立即 数 ” 
说 法 是 指 我 们 可 以 从 指令 中 立即 获得 该 操作 数 ， 即 我 们 不 需要 再 从 别 的 地 方 去 寻找 该 操作 数 。 0 

LC-3 共 支持 5 种 寻 址 模式 : 立即 数 、 寄 存 器 以 及 三 种 内 存 寻 址 模式 , 即 相 对 姓 址 (PC-relative)、 
间接 寻 址 (indirect)、 基 址 偏 移 (Base + offset)。 在 5.2 节 ， 我 们 将 学 习 两 种 寻 址 模式 : 寄存 器 和 


立即 数 ， 在 5.3 节 的 数据 搬移 指令 中 ， 将 采用 全 部 5 种 模式 。 


5.1.7. 条件 码 

有 关 LC-3 ISA 概 述 的 最 后 一 个 内 容 是 “条 件 码 ”(condition code)。 几 平 所 有 的 ISA (或 机 器 ) 
都 具备 “基于 之 前 指令 的 执行 结果 来 改变 指令 执行 序列 ”的 能 力 ， 其 中 的 机 制 就 是 “条 件 码 ”。 
LC-3 具 有 三 个 位 寄存 器 ( 单 bit 长 度 )， 每 当 8 个 通用 寄存 器 中 任意 一 个 被 修改 或 写 和 人 之 时 ， 三 个 单 
bit 位 就 会 发 生 对 应 变化 (被 置 1 或 清 零 )。 三 个 位 寄存 器 分 别 是 : N、Z 和 P， 对 应 的 意思 是 : 负数 、 
零 、 正 数 。 即 每 当 任意 GPR 寄存 器 被 写 和 时， 根据 写 人 结果 是 负数 、 零 或 正 数 ， 分 别 设置 三 个 条 
件 位 〈0 或 1) 。 例 如 ， 如 果 写 人 GPR 的 结果 是 负数 ， 则 位 置 1、Z 和 P 清 0， 如 果 结 果 为 0， 则 Z 置 1、 
P 和 N 请 0， 如 果 写 人 结果 是 正 数 ， 则 P 位 置 1、N 和 Z 祖 0。 

我 们 称 这 三 个 单 bit 寄 存 器 为 “条 件 码 ”， 因 为 控制 指令 可 根据 这 些 位 的 “条 件 (或 状态 )” 决 
定 执行 顺序 (或 方向 ) 是 否 改 变 。x86 和 SPARC 机 器 就 是 两 个 例子 ， 它 们 都 基于 条 件 码 来 控制 指令 
的 执行 顺序 。 在 5.4 节 中 ， 我 们 将 介绍 LC-3 是 怎样 做 的 。 


5.2 操作 指令 

操作 指令 是 处 理 数 据 的 指令 。 运 算 操作 (如 加 / 减 / 乘 / 除 ， 即 ADD/SUB/MUL/ADIV ) $2 $848 
作 〈 如 与 /或 / 非 / 异 或 ， BIAND/OR/NOT/XOR) 都 属于 典型 的 操作 指令 。LC-3 只 支持 三 种 操作 指令 
ADD、AND 和 NOT。 

NOT 指 令 (操作 码 =1001) 是 惟一 的 单 操作 数 (unary) 指令 ， 即 该 类 指令 只 需要 单个 源 操作 
数 。NOT 指 令 对 16 位 源 操作 数 做 “ 按 位 取 反 ”(bit-wise complement) ， 并 将 结果 存 人 目的 寄存 器 。 
NOT 指 令 对 源 和 目的 操作 数 的 访问 都 是 “寄存 器 寻 址 模式 ”。 其 中 bit[8:6] 是 源 寄 存 器 ，bit[11:9] 是 
目的 寄存 器 bit[5:0]79 1, 

如 果 R5 寄 存 器 的 内 容 是 0101000011110000， 则 执行 以 下 指令 之 后 ， 

15 14 B 02 d 10 9 8 7 6 5 4 5 2 1 0 


NOT R3 R5 
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R3 的 内 容 将 是 1010111100001111。 

如 图 5-4 所 示 是 数据 通路 中 执行 NOT 有 关 的 关键 部 分 。 由 于 NOT 是 单 操作 数 指令 ， 所 以 ALU 的 
输入 只 有 A。ALU 的 信号 表明 是 NOT 操 作 ( 按 位 取 反 操作 ) ， 源 操作 数 是 R5， 运 算 结 果 写 入 R3 寄 
frs. 






0101000011110000 


1010111100001111 







NOT 


图 5-4 执行 NOT R3, R5 的 数据 通路 


ADD (操作 码 =0001) 和 AND (操作 码 =0101) 都 是 双 操 作 数 (binary) 指令 ， 即 它们 都 需要 
两 个 16 位 的 源 操作 数 。ADD 指 令 执行 两 个 操作 数 的 补 码 加 法 ，AND 指 令 对 两 个 操作 数 的 16 个 位 中 
的 每 个 “bit 对 ”做 “ 按 位 与 ”(bit-wise AND) 操作 。 同 NOT 一 样 ，ADD 和 AND 的 源 操作 数 之 一 
(bit[8:6]) 和 目的 操作 数 (bit[11:9]) 都 是 寄存 器 寻 址 方式 ， 运 算 结 果 写 人 目的 寄存 器 。 

但 ADD 和 AND 指 令 的 第 二 个 源 操作 数 录 址 方式 ， 则 可 以 是 寄存 器 方式 或 立即 数 方式 (bit[5] 指 
明 是 两 种 模式 中 的 哪 一 种 )。bit[5]=0 表 明 第 二 个 源 操作 数 是 寄存 器 ，bit[2:0] 则 代表 该 寄存 器 。 这 
种 情况 下 bit[4:3]=00。 

例如 ， 如 果 R4 内 容 为 6，R5 为 -18， 则 以 下 指令 执行 之 后 


15 14 03 12 11 10 9 8 7 6 5 4 3 2 1 0 
ADD RI R4 R5 
R1 内 容 为 12。 


如 果 bit[5]=1， 则 表明 第 二 个 操作 数 携带 在 指令 之 中 ， 即 对 bit[4:0] 做 16 位 扩展 之 后 再 参加 运算 。 
图 5-5 所 示 是 执行 指令 “ADD RI, R4, #-2” 的 数据 通路 中 的 关键 部 件 。 
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图 5-5 执行 ADD RI, R4, #-2 的 相关 数据 通路 
由 于 在 ADD 和 AND 指 令 中 ， 只 有 bit[4:0] 字 段 可 以 表示 立即 数 ， 所 以 可 表示 的 操作 数 〈 补 码 形 


序列 是 什么 ? 
答案 : 


O 事实 上 只 有 负数 是 这 样 的 。 一 一 译 者 注 
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思考 题 : 该 执行 序列 产生 的 一 个 不 好 的 “副作用 ”是 什么 ? ERRAN? 


5.3 数据 搬移 指令 


数据 搬移 指令 的 任务 是 在 通用 寄存 器 (GPR) 和 内 存 之 间 、 寄 存 器 和 输入 /输出 设备 之 间 搬 动 
数据 。 其 中 ， 有 关 在 寄存 器 和 设备 之 间 相 互 搬 移 数据 的 话题 ， 将 放 在 第 8 章 和 第 9 章 的 一 个 重要 部 
分 展开 。 本 章 只 讨论 内 存 和 通用 寄存 器 之 间 的 数据 搬移 。 À 

我 们 称 数 据 从 内 存 移 人 寄存 器 为 “装载 ”(load) ， 而 从 寄存 器 转 和 人 内存 为 “看 储 ”(store)。 注 
意 ， 在 两 种 情况 下 ， 数 据 源 (或 源 操作 数 ) 的 信息 内 容 都 不 会 因为 此 移动 而 改变 ;但 目的 操作 数 
的 内 容 将 被 刷新 ， 即 以 前 的 内 容 被 破坏 了 。 

LC-3 有 7 种 搬移 指令 : LD、LDR、LDI、LEA、ST、STR 和 STI。 

load 和 store 指 令 的 格式 如 下 : 

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 


amm 地 址 生成 位 


数据 搬移 指令 需要 两 个 操作 数 : 源 和 目的 。 源 是 指 将 被 搬移 的 数据 ， 目 的 是 指 搬移 的 去 处 . 
(或 目的 ) 。 两 个 操作 数 之 一 必然 是 寄存 器 ， 另 一 个 则 是 内 存 或 输入 /输出 (IO) 设备 。 如 我 们 前 面 
说 过 的 ， 对 于 第 二 个 操作 数 ， 本 章 只 讨论 内 存 ， 有 关 输 入 /输出 设备 的 讨论 ， 留 到 第 8 章 再 讨论 。 

bit[11:9] 标 识 了 操作 数 之 一 ， 即 寄存 器 。 如 果 是 load 类 型 指令 ， 则 该 字段 代表 DR (Ap 
Destination Register, 目的 寄存 器 ) ， 即 指令 周期 结束 时 ， 来 自 内 存 的 内 容 将 被 SUN NUR 如 果 


是 store 指 令 ， 则 SR 代表 该 寄存 器 内 容 将 被 写 人 内 存 。 
bit[8: 0] 是 “地 址 生成 位 ”(address generation bit) 。 这 意味 着 基于 bit[8:0] 的 信息 ， 可 以 计算 出 


第 二 个 操作 数 的 16 位 地 址 。 在 LC-3 中 ， 有 4 种 生成 地 址 (或 阐释 bit[8:0]) 的 方法 ， 也 就 是 4 种 寻 址 
模式 。 采 用 哪 种 寻 址 模式 是 由 操作 码 决定 的 。 


5.3.1 PC 相对 寻 址 


LD (opcode=0010) 和 ST (opcode=0011) 采用 PC 相对 (PC-relative) 寻 址 模式 。 该 寻 址 模式 之 所 
以 这 么 命名 ， 是 因为 bit[8:0] 代 表 的 是 相对 当前 PC 的 偏 移 值 。 地 址 计算 方法 是 ， 先 将 bit[8:0] 内 容 做 16 位 
扩展 ， 然 后 与 PC 值 (CHE) 相 加 。 已 增 量 PC 的 内 容 是 当前 指令 在 取 指 令 节 拍 之 后 的 值 。 如 果 是 load 
操作 ， 计 算出 来 的 地 址 就 是 将 被 读 取 的 内 存单 元 的 地 址 ， 读 取 结果 被 存 人 bit[11:9] 指 定 的 寄存 器 。 

假设 下 列 指令 存放 在 地 址 x4018 中 ， 则 被 读 取 内 存 的 地 址 是 x3FC8， 结 果 存 放 在 R2 中 。 
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图 5-6 所 示 是 该 指令 执行 的 关键 数据 通路 ， 其 中 标注 了 LD 执 行 的 三 个 步骤 :一 是 将 已 增 量 PC 
(x4019， 原 先是 x4018) 与 IR[8:0] 内 容 (xFFAF) 相 加 ， 得 出 的 结果 (x3FC8) 被 装 人 MAR， 二 是 
读 取 地 址 为 x3FC8 的 内 存单 元 ， 其 内 容 暂 存 人 MDPR (假设 该 单元 的 内 容 是 5) . 第 三 步 则 是 将 内 容 


5 装 和 信 R2， 指 令 周 期 结束 。 


PC 





图 5-6 LD R2, x1AF 执 行 时 的 数据 通路 


注意 ， 内 存 地 址 的 范围 是 受 限 的 (不 是 整个 地 址 空间 的 范围 )， 即 该 地 址 只 在 相对 当前 LD 或 
ST 指令 所 在 地 址 的 +256 和 一 255 范 围 内 (注意 ， 在 偏 移 量 相 加 之 前 PC 已 被 增 量 ) ， 另 外 ， 指 令 中 
bit[8:0] 的 内 容 是 一 个 有 符号 的 数值 。 


5.3.2 间接 寻 址 


LDI (opcode-1010) 和 STI (opcode=1011) 指令 采用 的 是 间接 寻 址 模式 。 首 先 ， 采 用 和 LD 或 
ST 一 样 的 方法 计算 出 一 个 地 址 。 但 是 该 地 址 不 是 提取 或 存 人 操作 数 所 用 的 地 址 ， 事 实 上 ， 该 地 址 
中 存放 的 是 另 一 个 地 址 ， 后 者 才 是 load 或 store 操 作 数 的 真正 地 址 。 因 而 ,我 们 称 之 为 “间接 ”模式 。 
值得 注意 的 是 ， 这 种 方式 下 可 寻 址 的 范围 是 整个 内 存 空 间 的 任意 地 方 ( 而 不 是 LD 和 ST 之 PC 相对 模 
式 下 的 +256~-255 受 限 范围 )。 同 其 他 10ad 类 和 store 类 指令 一 样 ， 指 令 的 bit[11:9] 字 段 标 识 了 LDI 的 


目的 寄存 器 和 STI 的 源 寄 存 器 。 

假设 下 列 指令 的 地 址 是 x4A1B， 地 址 x49E8 的 内 容 是 x2110， 该 指令 的 执行 结果 是 R3 寄 存 器 被 
装 入 内 容 x2110。 
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图 5-7 是 与 执行 该 指令 相关 的 关键 数据 通路 。 如 同 LD 和 ST 指 令 一 样 ， 第 一 步 是 产生 地 址 ， 即 
将 PC (x4A1C) 与 1RI8:0] 的 符号 扩展 值 (xFFCC) 相 加 ， 并 将 结果 (x49E8) 装 入 MAR 寡 存 器 ; 
第 二 步 是 读 取 内 存 ， 将 地 址 x49E8 的 内 容 (x2110) 读 人 MDR， 第 三 步 中 ， 由 于 x2110 不 是 操作 数 
(而 是 操作 数 所 在 的 地 址 值 ) ， 因 而 它 又 被 装 人 MAR， 第 四 步 是 再 次 读 取 内 存 ，MDR 再 次 被 装 入 。 
这 一 次 MDR 的 内 容 则 是 地 址 x2110 的 内 容 。 假 设 x2110 的 内 容 是 -1， 那 么 在 第 五 步 中 ，MDR 的 内 容 
(-1) 被 装 信 R3， 至 此 ， 指 令 周 期 结束 。 


PC 





图 5-7 LDI R2, x1CC 指 令 执 行 时 的 数据 通路 


5.3.3 基 址 偏 移 寻 址 


LDR (opcode=0110) 和 STR (opcode=0111) 采用 的 是 基 址 二 偏 移 (Base + offset) 的 寻 址 模 
式 。 之 所 以 命名 为 “ 基 址 + 偏 移 ”模式 ， 是 因为 操作 数 的 地 址 是 由 6-bit 偏 移 量 的 符号 扩展 和 基 址 寄 
存 器 的 内 容 相 加 而 成 的 。6-bit 的 偏 移 量 来 源 于 指令 的 bitf5:0] 字 段 ， 而 基 址 寄存 器 则 由 指令 的 
bit[f8:6] 字 段 标识 。 

基 址 偏 移 寻 址 中 ，6-bit 补 码 的 表示 范围 为 -32 至 +31 之 间 ， 它 必须 先 符 号 扩展 为 16 位 值 ， 然 后 


才能 与 基 址 寄存 器 相 加 。 
假设 R2 的 内 容 是 16 位 数值 x2345， 则 下 列 指令 的 执行 会 将 内 容 x2362 装 人 有 R1。 
15 14 13 12 li 10 9 8 7 6 5 4 3 2 1 0 
LDR RI R2 x1D 


图 5-8 所 示 是 执行 该 指令 的 关键 数据 通路 。 首 先 ，R2 的 内 容 (x2345) 与 IR[5:0] 内 容 (x001D) 
相 加 ， 结 果 (x2362) 装 入 MAR， 其 次 ， 读 内 存 并 将 x*2362 的 内 容 装 入 MDR。 假 设 内 存 x*2362 的 内 
容 是 x0FOF， 则 第 三 步 将 MDR 内 容 (xOFOF) 装 入 R1。 
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15 0 


LDR RI R2 x1D 


IR 


图 5-8 LDR R1, R2, X1D 指 令 执 行 时 的 关键 数据 通路 
值得 一 提 的 是 ， 在 基 址 偏 移 寻 址 模式 下 ， 操 作 数 的 可 寻 址 范围 也 是 任意 的 〈 全 内 存 空间 ) 。 


5.3.4 立即 数 寻 址 


数据 搬移 指令 的 第 4 种 也 是 最 后 一 种 寻 址 模式 是 立即 数 寻 址 模式 。 该 模式 只 用 于 有 效 地 址 装载 
指令 (load effective address, LEA)。LEA (opcode=1110) 将 增 量 PC 与 bit[8:0] 的 符号 扩展 值 相 加 ， 
并 装 入 bit[11:9] 指 定 的 寄存 器 。 立 即 数 模式 的 命名 原因 是 : 被 装 和 寄存 器 的 数值 的 获取 是 “立即 的 ” 
(直接 从 当前 指令 字段 中 抽取 ， 而 不 需要 任何 内 存 访问 )。 

LEA 指 令 的 用 途 是 对 寄存 器 做 初始 化 ， 即 向 寄存 器 装 入 一 个 地 址 值 ， 且 该 地 址 是 与 当前 指令 
很 相近 的 一 个 地 址 。 假 设 地 址 x4018 处 包含 指令 LEA R5,#-3， 即 PC 内 容 为 x4018， 那 么 下 列 指令 
( 即 x4018 处 指令 ) 执行 之 后 ，R5 的 内 容 为 x4016。 





图 5-9 所 示 是 执行 LEA 指 令 的 关键 数据 通道 。 注 意 ， 该 指令 的 执行 也 无 需 访 问 内 存 。 
再 次 声明 一 下 ，LEA 指 令 是 “惟一 的 ”， 一 个 无 需 访 问 内 存 的 load 类 型 指令 。 它 将 由 增 量 PC 和 
指令 的 地 址 生成 bit 内 容 相 加 ， 产 生 的 地 址 值 装 入 DR (目的 寄存 器 )。 
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图 5-9 LEA R5,#-3 指 令 执行 时 的 关键 数据 通路 


5.8.5 一 个 例子 


下 面 我 们 通过 一 个 完整 的 例子 ， 总 结 一 下 学 过 的 各 种 寻 址 模式 。 假 设 地 址 x30F6~x30FC 范 围 
的 内 容 如 图 5-10 所 示 ， 当 前 PC 值 为 x30F6， 试 观测 7 个 指令 周期 之 后 的 运行 结果 。 





RI«-PC-3 
R2«-R1«14 
MI[x30F4]< 一 R2 
R2«-0 

R2«-R245 
M[R1i+14]< 一 R2 
R3< 一 M[M[x3F04]] 





图 $-10 各 种 寻 址 模式 的 示例 


最 初 PC 指向 x*30F6， 或 者 说 第 一 条 将 要 执行 的 指令 存储 在 x30F6。 其 操作 码 是 “1110” 一 一 
LEBA 指 令 ， 即 将 源 操 作 数 bit[8:0] 的 符号 扩展 值 和 增 量 PC 值 相 加 ， 然 后 将 求 和 结果 写 人 目的 寄存 器 
bit[11:9]。bitf8:0] 的 16 位 符号 扩展 值 为 xFFFD ， 增 量 PC 值 等 于 x30F7， 因 而 LEA 指 令 结束 后 ，R1 的 
内 容 为 x30F4，PC 为 x30F7。 

第 2 条 指令 的 位 置 是 x30F7。 其 操作 码 是 “0001” 一 ADD 指令 ， 它 将 bit[8:6] 指 定 的 寄存 器 与 
bit[4:0] 立 即 数 (因为 bit[5]=1) 的 符号 扩展 值 相 加 ， 求 和 结果 存 人 bit[11:9] 寄 存 器 。 因 为 之 前 的 指 
令 已 在 R1 中 存 信 x30F4， 立 即 数 符号 扩展 后 的 值 为 x000E ， 因 而 R2 的 装 入 值 为 x3102。 指 令 结束 后 ， 
R1 的 内 容 仍然 为 x230F4，R2 为 x3102，PC 则 增 量 为 x30F8。 

第 3 条 指令 的 位 置 是 x30F8。 操 作 码 是 “0011” 一 一 ST 指令 ， 即 采用 PC 相对 寻 址 模式 将 寄存 器 
内 容 写 人 当前 指令 附近 的 内 存单 元 。 该 内 存单 元 地 址 的 计算 是 PC 增 量 值 与 bit[8:0] 符 号 扩展 值 相 加 ， 
然后 将 bit[11:9] 寄 存 器 内 容 写 人 该 内 存单 元 中 。bit[8:0] 的 符号 扩展 值 是 xFFFB ， 增 量 PC 的 值 是 
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x30F9。 因 而 ，ST 指 令 结束 后 ， 内 存 x30F4 中 的 内 容 为 x3102，PC 为 x30F9。 

在 x30F9， 我 们 发 现 操 作 码 0101 一 一 即 AND 指 令 。 执 行 之 后 ，R2 为 0，PC 为 x30FA。 

在 x30FA， 我 们 发 现 操 作 码 0001 一 一 即 ADD 指 令 。 执 行 之 后 ，R2 为 5S，PC 为 X30FB。 

在 x30FB ， 我 们 发 现 操 作 码 0111 一 一 即 STR 指 令 。STR 指 令 ( 同 LDR 指 令 一 样 ) 采用 基 址 + 偏 
移 寻 址 模式 。 内 存 地 址 是 由 基 址 寄存 器 (bit[8:6]) 和 偏 移 (bit[5:0] 的 符号 扩展 ) 求 和 而 得 。 本 例 
中 ，bit[8:6] 指 定 了 R1， 而 R1 内 容 仍然 是 x30F4， 偏 移 (offset) 的 16 位 符号 扩展 值 为 x000E。 由 于 
x30F4 + x000E = x3102， 所 以 内 存 地 址 是 x3102。 因 而 STR 指 令 将 bit[11:9] 指 定 的 寄存 器 (R2) 内 
容 存 和 地址 为 x3102 的 内 存单 元 。 回 顾 前 面 的 执行 ，R2 当 前 的 内 容 应 该 是 5， 即 意味 着 指令 执行 之 
后 ，x3102 单 元 的 内 容 为 5，PC 内 容 为 x30FC。 

在 x30FC， 我 们 发 现 操作 码 1010 一 一 好 LDI 指 令 。LDI 指 令 ( 同 STI 指 令 -- 样 采用 间接 寻 址 模 
式 。 该 模式 下 ， 它 事先 采用 和 PC 相对 寻 址 模式 相同 的 计算 方法 获得 一 个 地 址 。 本 例 中 ，bit[8:0] 的 
16 位 符号 扩展 值 是 xFFF7， 增 量 PC 为 x30FD， 则 它们 求 和 得 x30F4 (这 只 是 存放 操作 数 所 在 的 地 址 
的 内 存 地 址 一 一 “地 址 的 地 址 ”)。 内 存 地 址 x30F4 的 内 容 是 x3102， 这 个 地 址 是 最 终 的 操作 数 所 在 
的 地 址 。LDI 将 该 地 址 中 的 内 容 (本 例 中 为 5) 装 入 bit[11:9] 指 定 的 寄存 器 (R3)。 执 行 结果 是 ，R3 
等 于 5，PC 为 x30FD， 


5.4 控制 指令 


控制 指令 是 指 那些 能 够 改变 指令 执行 顺序 的 指令 。 如 果 设 有 控制 指令 ， 当 前 指令 完毕 后 的 下 
一 条 执行 指令 (时 间 顺 序 ) 一 定 也 是 内 存 位 置 顺序 的 下 一 条 《空间 顺序 )。 这 是 因为 取 指 令 节 拍 
(FETCH) 之 后 ，PC 总 是 自动 增 量 加 1， 但 下 面 我 们 会 看 到 ， 在 很 多 情况 下 ， 需 要 打破 这 种 顺序 执 
行 。 

LC-3 有 5 种 操作 码 可 以 打破 这 种 顺序 : 条 件 跳 转 、 无 条 件 跳 转 、 子 程序 (ARREK) WH, 
TRAP、 中 断 返 回 。 在 本 节 中 ， 我 们 讨论 的 主要 内 容 是 最 常用 的 “条 件 跳 转 指令 ， 无 条 件 跳 转 和 
TRAP 指 令 也 会 有 所 介绍 。 其 中 ，TRAP 非 常 有 用 ， 因 为 它 使 得 你 可 以 在 无 需 了 解 输入 /输出 设备 等 
复杂 的 计算 机 组 织 细节 的 情况 下 ， 与 计算 机 交互 信息 ,为 什么 呢 ? 别 着 急 ， 我 们 将 有 关 TRAP 指 令 、 
子 程序 调用 、 中 断 返 回 等 话题 ， 留 在 了 第 9、10 章 。 . 


5.4.1 条 件 跳 转 指 令 
条 件 跳 转 指 令 (opcode=0000) 的 格式 如 下 所 示 : 


15 14 13 12 H 10 9 8 7 6 5 4 3 2 I 0 


0 0 0 0 Z P PC 偏 移 . 


其 由 ，bit[111、[101、f9] 分 别 对 应 了 5.1.7 节 中 讨论 的 三 个 条 件 码 ,“ 所 有 ”会 对 寄存 器 进行 
操作 的 指令 都 会 设置 这 三 个 条 件 码 (之 一 ) ， 这 些 指 令 包括 ADD、AND、NOT、LD、LDI、LDR 
和 LEA。 

条 件 码 的 使 用 方法 是 ， 条 件 跳 转 指令 通过 对 条 件 码 的 判断 ， 来 决定 是 否 改变 指令 注 ， 换 句 话 
说 ， 即 是 否 改变 正常 的 顺序 (sequential) 执行 方式 (在 每 条 指令 的 取 指令 节拍 ， 自 动 对 PC 增 量 ) 。 

在 控制 指令 的 指令 周期 中 ， 取 指令 (FETCH) 和 译 码 (DECODE) 节拍 没有 什么 特殊 的 ， 取 
指令 节拍 之 后 ，PC 自 动 增 量 ， 地 址 计算 节拍 (EVALUATE ADDRESS) 也 与 LD 和 ST 指 令 相同 ， 即 
将 增 量 PC 和 指令 pit[8:0] 的 16 位 符号 扩展 值 相 加 求 得 地 址 。 

而 在 执行 节拍 (EXECUTE)， 处 理 器 将 检测 菜 个 条 件 码 (对 应 指令 中 指定 的 条 件 码 ) 是 否 为 1。 
如 果 指 令 的 bit[11]=1， 则 检查 条 件 码 N， 如 果 bit[10]=1， 则 检查 条 件 码 Z， 如 果 bit[9]=1， 则 检查 条 件 
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码 P。 如 果 bit[11:9] 三 个 位 全 是 0， 则 不 检查 任何 条 件 码 。 任 意 一 个 条 件 码 的 状态 为 1， 都 将 使 得 PC 内 
容重 新 修改 ， 即 将 地 址 计算 节拍 (EVALUATE ADDRESS) 生成 的 地 址 重新 装 信 PC， 而 如 果 所 有 条 
件 码 的 状态 都 为 0， 则 PC 内 容 保持 不 变 (意味 着 在 下 一 个 指令 周期 ， 将 顺序 地 读 取 下 一 条 指令 ) 。 

例如 ， 假 设 最近 装 入 寄存 器 的 内 容 是 0， 则 如 下 的 指令 (位 置 在 地 址 x4027) 将 对 PC 装 入 
x4101， 即 下 一 条 要 执行 的 指令 来 自 x4101 (而 不 是 x4028)。 





BR n z P X0D9 

图 5-11 是 执行 该 指令 的 关键 数据 通路 。 注 意 其 中 的 判断 逻辑 ， 即 决定 指令 流 是 否 是 顺序 的 。 
本 指令 的 答案 是 “yes”， 因 而 PC 被 重新 装 入 x4101， 蔡 换 原先 的 x4028 ( 取 指 令 阶 段 自动 装 入 的 增 
E). 

如 果 所 有 的 三 个 位 bit[11:9] 都 是 1， 则 三 个 条 件 码 都 将 被 检测 。 那 么 ， 什 么 情况 下 需要 检查 所 
有 的 条 件 码 状态 呢 ? 在 回答 之 前 ， 我 们 先 分 析 一 下 它 的 执行 细节 。 首 先 ， 不 论 在 什么 情况 下 ， 三 
个 条 件 码 中 至 少 有 一 个 是 1， 因 为 之 前 的 寄存 器 装 人 内 容 可 能 是 负数 、0 或 正 数 (不 存在 其 他 的 选 
择 ) ， 其 次 ， 如 果 指 令 检测 所 有 的 三 个 条 件 状 态 位 ， 则 必定 有 一 个 命中 〈 即 匹配 )。 换 名 话说 ，PC 
内 容 必 然 要 更 新 ， 即 装 入 在 地 址 计算 阶段 得 出 的 地 址 。 现 在 我 们 可 以 回答 刚才 的 问题 了 ， 由 于 这 
种 指令 “必定 《或 无 条 件 ) ”地 要 改变 已 有 的 PC 内 容 (顺序 的 ) ， 所 以 我 们 称 这 种 检查 所 有 条 件 状 
态 位 的 指令 为 “无 条 件 跳 转 ” (unconditional branch) 指令 。 

假设 如 下 的 指令 所 在 的 地 址 是 x507B ， 则 该 指令 执行 之 后 ，PC 内 容 为 x5001 。 

顺便 再 问 个 问题 ， 如 果 跳 转 (BR) 指令 的 三 个 检测 位 bit[11:9] 都 是 0， 将 发 生 什 么 情况 ? 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 
0 0 0 0 1 1 1 1 1 0 0 0 0 1 0 1 
BR n z p x185 





n [orf] 
9 





Yes! 


图 5-11 执行 BRz x0D9 指 令 的 关键 数据 通路 
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5.4.5 一 个 例子 
下 面 通过 一 个 简单 的 例子 ， 讲 述 控制 指令 在 指令 集中 的 重要 
价值 。 


R1 <- x3100 
R3 «- 0 
R2 <- 12 


假设 在 地 址 x3100~x310B 之 间 包 含 了 12 个 整数 ， 我 们 希望 写 
个 程序 对 它们 求 和 。 解 决 这 个 问题 的 算法 描述 如 图 5-12 所 示 。 

首先 ， 与 所 有 的 算法 一 样 ， 我 们 必须 “初始 化 变量 ”"， 即 要 
对 算法 中 使 用 到 的 变量 设置 其 初始 值 。 在 此 算法 中 ， 涉 及 三 个 变 
dk: 下 一 个 待 求 和 整数 的 地 址 (存放 在 R1 中 )， 求 和 累计 变量 
(存放 在 R3)， 还 未 计算 的 整数 数目 (存放 在 R2)。 这 三 个 变量 的 
初始 化 内 容 分 别 为 ， R1 的 初始 值 为 第 一 个 整数 的 地 址 ，R3 因 为 是 


不 断 记 录 累 计 和 的 ， 所 以 被 初始 化 为 0，R2 记 录 的 是 还 未 求 和 的 pA 
整数 的 数目 ， 所 以 初始 值 为 12。 | nem 


初始 化 之 后 ， 就 开始 求 和 过 程 。 程 序 重复 下 面 的 过 程 ， 从 12 
个 整数 中 读 取 一 个 新 的 整数 存 人 R4， 然 后 加 入 R3。 另 外 ， 在 每 执 
行 一 次 ADD 运 算 的 同时 ，R1 被 增 量 (地 址 ) 指向 下 一 个 待 求 
和 整数 ，R2 则 被 碱 量 ( 减 1) 一 一 告诉 我 们 后 面 还 有 多 少 个 整数 
有 待 计算 。 当 R2 变 为 0 的 时 候 ， 条 件 码 位 Z 被 置 1， 通 过 它 我 们 知道 ， 事 情 已 经 完成 了 。 








图 5-12 对 12 个 整数 求 和 的 算法 


地 址 15 14 13 12 H 10 9 8 7 6 5 4 3 2 1 0 

x3000 1 R1«—3100 
x3001 1 R3«-0 
x3002 R2«-0 
x3003 R2«-12 
x3004. BRz x300A 
x3005 Fi olo » 1] Réc-MIRI 
mes [o oo lo 3 [o 3 3 [o9 of oo| fecto 
x3007 [0 0 RI«-RI-«1 
x3008 R2«-R2-1 





BRnzp x3004 


图 5-13 实现 图 5-12 算 法 的 程序 


图 5-13 所 示 是 实现 该 算法 的 一 个 小 程序 (10 条 指令 )。 
其 中 : 


* 程序 起 始 于 PC=x3000， 此 第 一 条 指令 的 任务 是 ， 将 地 址 值 x3100 装 入 Ri 寄存器 (OA Bp E E 
PC=x3001，PCoffset 的 符号 扩展 值 =x00FF， 两 者 求 和 为 x3100)。 

。 随 后， 位 于 x3001 的 指令 负责 将 R3 清 0。R3 的 任务 是 记录 累计 和 ， 所 以 它 必 须 被 清 0， 即 如 前 
面 所 说 的 “初始 化 SUM 为 0”。 

e 位 于 x3002 和 x3003 的 指令 负责 给 R2 赋 值 (=12)， 即 被 累计 整数 的 数目 。R2 的 任务 是 跟踪 已 
有 多 少 整数 被 加 过 了 ， 该 任务 是 通过 位 于 地 址 x3008 的 指令 在 每 次 加 法 之 后 都 对 R2 减 1 实现 
的 。 

。 位 于 x3004 的 是 条 件 跳 转 指令 。 注 意 ， 该 指令 的 bit[10]=1， 即 该 指令 要 检查 条 件 码 Z。 如 果 Z 

状态 为 1， 就 意味 着 之 前 的 R2 内 容 已 被 减 为 0 了 ， 工 作 结束 了 。 如 果 Z 状 态 为 0， 则 意味 着 工 
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作 还 没完 成 ， 还 得 继续 。 

。 位 于 x3005 的 是 load 类 指令 ， 将 位 于 x3100 的 内 容 (第 一 个 整数 ) 装 人 R4， 然 后 由 位 于 x3006 
的 指令 将 其 加 入 R3。 

。 位 于 x3007 和 x3008 的 指令 负责 一 些 常务 性 的 收尾 (bookkeeping) 工作 。x3007 的 指令 对 R1 
增 量 ， 使 之 指向 下 一 个 新 的 待 加 入 整数 (如 地 址 x3101) ; 而 x3008 的 指令 对 R2 减 量 ， 用 于 
记录 还 有 多 少 个 整数 还 未 加 入 ， 同 时 该 指令 的 执行 还 影响 着 条 件 码 W、Z、P 的 状态 值 。 

。 位 于 x3009 的 是 一 条 无 条 件 跳 转 指令 (从 其 bit[11:9] 全 为 1 可 以 判断 出 来 ) 。 它 向 PC 装 和 人 x3004。 
该 指令 的 执行 不 会 影响 条 件 码 ， 所 以 ， 之 后 将 执行 的 条 件 跳 转 指令 (x3004) 将 基于 x3008 
的 指令 (改变 条 件 码 ) 。 

值得 注意 的 是 ， 在 转折 点 的 指令 执行 顺序 是 x3008 一 x3009 一 x3004， 但 因为 x3009 的 指令 不 影 
响 条 件 码 ， 因 而 事实 上 是 x3008 的 指令 结果 (会 影响 条 件 码 ) 决定 了 x3004 指 令 的 执行 结果 ( 即 顺 
序 执行 或 跳 转 ) 。x3008 的 指令 之 所 以 会 改变 条 件 码 ， 是 因为 它 对 R2 减 1 并 写 回 R2。 如 果 还 有 整数 
需要 加 入 ， 则 x3008 的 ADD 指 令 产生 的 结果 必然 是 大 于 0 的 〈 即 Z 条 件 码 是 被 清 0 的 ) 。 而 x3004 的 条 
件 跳 转 指令 将 检查 该 条 件 码 位 Z， 如 果 Z 被 清 0 了 ， 则 PC 不 会 被 修改 ， 即 下 一 个 指令 周期 的 指令 将 
从 x3005 继 续 获取 。 

从 x3000 开 始 ， 在 条 件 跳 转 指令 的 控制 下 ， 指 令 的 执行 序列 为 : x3000, x3001, x3002, x3003， 
x3004, x3005, x3006, x3007, x3008, x3009, x3004, x3005, x3006, x3007, x3008, x3009, x3004, 
x3005, ==- 如 此 反复 直到 R2 变 为 0， 这 样 ， 下 次 再 执行 xz3004 的 条 件 跳 转 指令 时 ，PC 将 被 修改 为 
x300A， 即 程序 将 跳 转 至 x300A 继 续 。 

最 后 ， 值 得 一 提 的 是 ， 我 们 也 可 以 在 不 使 用 任何 控制 指令 的 情况 下 ， 写 出 一 个 对 12 个 整数 求 
和 的 程序 。 我 们 仍然 需要 地 址 x3000 的 R1 初 始 化 指令 ， 但 不 需要 累计 、 变 量 初 始 化 指令 (x3001) 
和 剩余 整数 数目 变量 初始 化 代码 (x3002 和 x3003)。 我 们 可 以 直接 将 x3100 的 内 容 装 入 R3， 然 后 重 
复 地 (通过 增 量 R1、 将 整数 装 和 信 R4、 将 R4 累 加 到 R3) 加 入 其 他 11 个 整数 。 在 第 12 个 〈 即 最 后 一 个 ) 
整数 加 完 之 后 ， 我 们 可 以 转 入 下 一 个 任务 (如 图 5-13 中 x3004 处 的 跳 转 指 令 所 做 的 一 样 )。 

不 幸 的 是 ， 没 有 控制 指令 (或 跳 转 指令 ) 的 新 程序 代码 长 达 35 行 指令 《而 不 是 原先 的 10 行 ) 。 
如 果 我 们 要 求 100 个 整数 的 和 ， 则 这 种 不 采用 控制 指令 的 写法 编 出 的 代码 将 长 达 299 条 指令 (而 原 
先 的 写法 仍然 是 10 条 指令 就 可 完成 )。 由 此 我 们 可 以 看 出 (如 图 5-13 所 示 )， 由 于 它 具 有 改变 指令 
执行 顺序 (或 方向 ) 的 能 力 ， 就 使 得 代码 得 以 重用 (reuse) 一 一 总 的 代码 长 度 变 短 了 。 


5.4.3 ”循环 控制 的 两 种 方法 


在 某 种 机 制 的 控制 下 ， 一 遍 一 遍地 被 重复 执行 的 指令 序列 称 为 “循环 ”(loop) 语句 。 在 12 
个 整数 求 和 的 代码 中 ， 就 包含 了 一 个 循环 。 循 环 体 代码 每 执行 一 遍 ， 累 计 和 就 加 入 了 一 个 新 整 
数 ， 计 数 器 也 被 减 1 (用 于 判断 剩余 整数 数目 )。 我 们 称 循环 体 每 执行 一 遍 为 “循环 体 执行 了 
一 轮 ”。 
控制 循环 体 执行 轮 数 的 方法 有 两 种 : 

(1) 采用 计数 器 方法 (如 前 所 述 )。 如 果 需 要 将 一 个 循环 执行 4 遍 ， 我 们 只 需要 将 计数 器 初始 
化 为 2。 然 后 每 执行 一 遍 循环 ， 就 将 计数 器 减 1 并 判断 其 是 否 为 0。 如 果 计 数 器 不 为 0， 则 重新 设置 
PC 至 循环 的 人口 ， 然 后 开始 下 一 轮 执 行 。 

(2) 第 二 种 方法 是 采用 “哨兵 法 ”(sentinel)。 这 种 方法 在 我 们 “事先 不 知道 要 循环 多 少 次 ” 
的 情况 下 特别 有 效 。 同 “计数 器 方法 ”不 同 的 是 ,“ 哨 兵法 ”通过 “对 数据 内 容 (而 不 是 计数 器 余 
数 ) 的 判断 ”来 控制 循环 是 否 继续 。 哨 兵法 的 实现 方法 是 : 在 被 处 理 数据 序列 的 尾部 安放 一 个 
“哨兵 ”一 一 即 我 们 事先 就 知道 绝对 不 会 出 现 的 数值 。 例 如 ， 如 果 我 们 正在 对 一 个 数字 序列 做 “ 求 
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和 ”运算 ， 那 么 像 “#” 或 “*” 这 样 的 符号 ， 就 可 以 


做 “哨兵 ”( 因 为 它们 “绝对 ”不 是 数字 ) 。 所 以 ， 每 R1 < x83100 
次 循环 体 执行 时 ， 都 会 通过 判断 哨兵 是 否 出 现 (A R4 <- MIRI] 


断 当 前 已 读 取 的 数据 是 否 等 于 “哨兵 ”字符 ) 来 控制 
循环 体 是 否 继续 执行 ， 一 旦 发 现 “ 哨 兵 ， 我 们 就 知道 
任务 该 结束 了 。 


5.4.4 HF: 哨兵 法 数组 求 和 


以 $.4.2 节 为 例 ， 地 址 x3100~x310B 之 间 存 储 的 数 
据 全 部 是 正 数 ， 那 么 就 可 以 任意 选 一 个 负数 作为 “ 哨 
兵 "。 假 设 在 内 存 地 址 单元 xz310C 放 置 了 一 个 哨兵 一 1 ， 
则 该 求 和 计算 的 相应 算法 流程 图 就 如 图 5-14 所 示 ， 而 ema p 4 ; 
实现 程序 则 如 图 5.15 所 示 。 图 5-14 基于 “哨兵 ”方法 的 循环 控制 算法 

地 址 15 14 13 12 11 10 9 8 7 6 5 

x3000 1 
x3001 
x3002 
x3003 
x3004 
x3005 
x3006 
x3007 





R1«-—x3100 
R3«-0 
R4«-MIRI] 
BRn x3008 
R3<—R3+R4 
RI«-R1«1 
R4«-MIRI1] 
BRnzp x3003 





图 5-15 对 应 图 5-14 算 法 的 程序 


与 前 面 的 计数 器 方法 一 样 ，x3000 的 指令 向 R1 装 人 第 一 个 要 加 入 的 数据 所 在 的 地 址 ， 而 x3001 
的 指令 将 R3 (累积 和 ) 初始 化 为 0。 i 

位 于 x3002 的 指令 真正 地 将 内 存 中 (由 R1 指 向 ) 的 数据 装 入 R4。 如 果 此 时 装 和 人 的 是 “哨兵 ” 
数据 ， 则 条 件 码 位 N 必 然 自动 设置 为 1 (因为 正常 数据 都 是 正 数 ， 而 哨兵 数据 是 一 1)。 

位 于 x3003 的 条 件 就 转 指令 将 专门 检查 N 条 件 码 位 。 如 果 N 位 为 1， 则 设置 PC 为 x3008 ( 即 进行 
下 一 个 任务 ) ， 如 果 N 位 为 0，R4 必 然 包 含 了 一 个 有 效 数字 ， 则 该 数字 被 加 入 R3 (x3004)，R1 增 量 
指向 下 一 个 内 存单 元 地 址 (x3005)，R4 装 入 下 一 个 内 存单 元 的 内 容 (x3006), .PC 被 装 入 x3003 
( 即 无 条 件 跳 转 至 x3003) ， 开 始 下 一 轮 执行 (x3007)。 


5.4.5 JMP 指 令 


条 件 跳 转 指 令 存在 一 个 “致命 的 局 限 性 "， 即 下 一 条 指令 所 在 位 置 不 能 超出 “可 计算 ”范围 。 
所 谓 的 “可 计算 ”范围 是 指 PC 寄存 器 和 偏 移 量 (bit[8:0] 符 号 扩展 值 ) 的 求 和 值 。 由 于 bit[8:0] 是 补 
码 表 示 ， 则 9 个 bit 的 编码 所 表示 的 最 大 地 址 范围 是 距 当 前 跳 转 指令 前 后 +256 至 一 255 的 地 址 空间 。 
假如 我 们 要 执行 的 下 一 条 指令 是 距离 当前 指令 1000 的 位 置 ， 由 于 9 个 bit 的 字段 装 不 下 1000 这 么 大 的 


数值 ， 那 么 条 件 跳 转 指 令 是 无 法 完成 这 个 跳 转 任务 的 。 
为 此 LC-3 的 指令 集 就 提供 了 JMP 指 令 (操作 码 =1100)。JMP 指 令 格式 如 下 ， 
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LC-38E 46 
15 14 13 12 H 10 9 8 7 6 5 4 3 2 1 0 
JMP R2 


JMP 指 令 的 任务 就 是 将 寄存 器 (bit[8:6] 标 识 ) 的 内 容 装 人 PC 寄 在 器。 假设 JMP 指 令 位 于 x4000， 
R2 的 内 容 为 x6600， 则 JMP 指 令 执 行 完毕 后 ， 下 一 条 执行 指令 的 地 址 则 是 x6600。JMP 指 令 可 以 使 
得 程序 执行 流 跳 转 至 内 存 空间 的 任意 位 置 ， 其 中 的 关键 是 寄存 器 (如 R2) 的 宽度 是 16-bit， 它 可 以 
表达 内 存 空间 的 任意 地 址 。 


5.46 TRAP 指 令 


第 9 章 将 详细 介绍 TRAP 指 令 在 计算 机 数据 输入 /输出 操作 中 的 作用 ， 但 由 于 本 章 距 离 第 9 章 还 
很 远 ， 所 以 在 此 先 做 简 述 。TRAP 指 令 (操作 码 =1111) 的 任务 是 改变 PC 内 容 《与 JMP 指 令 很 相似 )， 
使 其 指向 操作 系统 所 在 空间 内 部 。 换 名 话说 ， 即 以 当前 程序 的 身份 跳 转 至 操作 系统 的 某 个 代码 人 
口 开始 执行 。 而 按照 操作 系统 的 术语 来 说 ， 我 们 称 TRAP 指 令 为 激活 了 操作 系统 的 服务 调用 
(SERVICE CALL)。TRAP 指 令 的 bit[7:0] 字 段 表示 的 是 “陷入 入 量 ”(trapvector) ， 我 们 可 以 将 
“矢量 (或 编号 ) ”理解 为 程序 希望 操作 系统 执行 的 服务 程序 的 编号 。 在 附录 A 的 表 A-2 中 ， 给 出 了 
LC-3 提 供 的 所 有 服务 所 对 应 的 陷入 笑 量 。 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 


1] 1 1 1 0 0 0 0 陷入 矢量 


操作 系统 在 完成 服务 调用 之 后 , 程序 计数 器 (PC) 将 被 设置 为 TRAP 指 令 后 的 下 一 条 指令 地 址 。 
这 意味 着 在 程序 正常 执行 的 过 程 中 ， 通 过 TRAP 指 令 可 以 随时 调用 操作 系统 的 服务 函数。 下 面 给 出 
几 个 操作 系统 服务 函数 的 例子 ， 


，” 读 取 键 盘 输 入 (trapvector = x23), 
”显示 器 字符 输出 {trapvector = x21), 
* 终止 (BALT) 程序 (trapvector = x25), 


有 关 LC-3 是 怎样 实现 当前 执行 程序 和 操作 系统 之 间 交 互 的 机 制 ， 是 第 9 章 的 一 个 重要 话题 。 


5.5 例子 : 字符 数 统计 


这 是 本 章 的 最 后 一 个 例子 。 该 例 程 从 键盘 读 入 一 个 字符 ， 并 统计 一 个 文件 中 该 字符 出 现 的 次 
数 《 计 数值 ) ， 最 后 在 显示 器 上 显示 该 计数 值 。 我 们 先 做 个 假设 -一 文件 中 任意 字符 的 出 现 次 数 很 
小 ， 即 最 多 只 有 9 次 。 之 所 以 做 这 种 假设 ， 原 因 是 :我们 希望 避 开 做 一 个 复杂 转换 一 一 二 进 制 数 至 
ASCII 码 的 转换 (第 10 章 将 介绍 此 话题 ) 。 

图 5-16 是 求解 该 问题 的 流程 图 ， 其 中 每 个 操作 步骤 都 分 别 用 英文 和 LC-3 操 作 (括号 内 ) 予以 
表示 。 

第 一 步 是 初始 化 工作 ， 即 对 RO0、R1、R2 和 R3 等 4 个 寄存 器 赋予 初始 值 。R2 代 表 字 符 出 现 的 次 
数 ， 初 始 值 为 0，R3 是 一 个 指针 (pointer)， 指 向 文件 中 的 下 一 个 待 读 字符 ， 初 始 值 等 于 文件 中 第 
一 个 字符 所 在 的 地 址 ，R0 的 内 容 则 是 待 检查 (或 匹配 ) 的 字符 ，R1 的 任务 则 是 保存 当前 正在 被 读 
取 的 文件 中 的 字符 。 

值得 注意 的 是 ， 我 们 没有 要 求 被 检查 文件 的 位 置 与 正在 开发 程序 的 距离 是 近 还 是 远 。 假 设 程 
序 的 位 置 是 x3000， 而 文件 的 位 置 是 x9000， 则 R3 的 初始 化 内 容 是 x9000。 

第 二 步 是 统计 输入 字符 的 出 现 次 数 。 实 现 方法 是 逐个 检查 文件 的 每 个 字符 ， 直 到 文件 结束 。 
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循环 体 每 执行 一 遍 处 理 一 个 。 回 顾 5.4.3 节 介绍 的 两 种 控制 循环 次 数 的 方法 ， 这 里 我 们 将 采用 
“哨兵 ”方法 ， 即 采用 EOT (End of Text) (00000100) 作为 哨兵 字符 。 和 参考 附 录 E 中 的 ASCII 字 
符 表 。 


Count «- 0 
(R2 <- 0) 


指针 内 容 初始 化 
(R3 «- M[x3012]) 


从 键盘 读 人 字符 
(TRAP x23) 


从 文件 获取 字符 
(R1 <- MIR3]) 


Yes 





计数 值 递增 
(R2 <- R2 +1) 


从 文件 获取 字符 
(R3 «- R3 +1 
R1 <— M[R3]) 


准备 输出 
(RO «— R2 + x30) 


(TRAP x21) 
(TRAP x25) 


图 5-16 统计 字符 出 现 次 数 的 算法 


LC-34£45 
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每 次 循环 的 开始 ， 将 RI 的 内 容 与 BOT 匹 配 。 如 果 相 同 ， 则 循环 结束 ， 程 序 转 至 最 后 一 步 ， 将 


计数 值 显示 在 屏幕 上 ， 如 果 不 相 同 ， 则 有 事情 做 了 。R1 (当前 待 检查 字符 ) 与 R0 (键盘 输入 字符 ) 
相 比 。 如 果 相 同 ， 则 R2 增 量 加 1。 无 论 如 何 〈 相 同 或 不 相同 ) ，R3 都 增 量 ， 指 向 下 一 个 字符 ， 并 将 
该 字符 装 入 R1， 然 后 返回 循环 体 的 入 口 ， 判 断 该 字符 是 否 是 哨兵 字符 一 一 文件 结束 符 。 


如 果 遇 到 的 是 文件 结束 符 ， 即 文件 所 有 内 容 都 已 检查 ， 则 当前 R2 包 含 的 就 是 键盘 输入 字符 在 


文件 中 出 现 的 次 数 。 但 这 个 计数 值 是 二 进 制 数 ， 为 了 能 在 屏幕 上 显示 ， 该 数值 必须 转换 成 ASCII 码 。 
由 于 事先 我 们 已 假设 计数 值 不 会 超过 10， 我 们 只 需要 在 4-bit 的 计数 值 前 面 直接 加 上 0011 即 可 。 为 
fra We? 我 们 先 查 看 一 下 附录 E 的 图 E-2 中 十 进 制 数 0 到 9 与 它们 的 ASCII 码 之 间 的 对 应 关系 , 很 简单 ， 
它们 的 对 应 关系 确实 如 此 一 一 在 4-bit 二 进 制 编码 的 前 面 ， 再 加 上 4-bit 的 0011。 


最 后 ， 程 序 将 转换 后 的 ASCH 码 (计数 值 对 应 的 ASCH 码 ) 输出 到 显示 器 上 ， 程 序 结束 。 


图 5-17 是 图 5-16 的 流程 图 所 对 应 的 机 器 代码 程序 。 
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图 5-17 实现 图 $-16 算 法 的 机 器 语言 程序 





R2<-0 
R3<-M[x3012] 


^ TRAP x23 


R1«-M[R3] 
R4«-R1-4 
BRz x300E 
R1«-NOT R1 
R1<-R1+1 
R1«-RI*RO 
BRnp x300B 
R2«-R241 
R3«-R341 
R1«-M[R3] 
BRnzp x3004 
RO«-M[x3013] 
RO<-RO+R2 
TRAP x21 
TRAP x25 


ASCIITEMPLATE 


首先 是 初始 化 操作 。x3000 的 指令 负责 对 R2 清 零 ， 即 将 R2 与 x0000 做 AND 操 作 ，x3001 的 指令 


则 将 x3012 的 内 容 装 人 R3。 这 是 文件 的 第 一 个 字符 所 在 的 地 址 。 此 外 ， 我 们 可 以 看 到 ， 采 用 R3 寄 
存 器 存放 地 址 ， 使 得 文件 可 以 存放 在 内 存 的 任意 位 置 。 当 然 ， 在 x3000 指 令 之 前 ， 必 须 有 一 序列 的 
指令 事先 将 文件 起 始 地 址 装 人 x3012。 位 于 x3002 的 是 一 条 TRAP 指 令 ， 即 意味 着 要 调用 操作 系统 的 
服务 。 该 TRAP 指 令 中 的 8-bit 陷 入 矢量 等 于 00100011 (或 x23) ， 即 从 键盘 读 入 一 个 字符 并 装 入 R0。 
参考 附录 A 的 表 A-2 中 列 出 的 所 有 操作 系统 服务 ， 其 中 x23 《如 表 A-2 所 示 ) 代表 读 入 下 一 个 键入 字 
符 ， 并 将 其 装 入 RO 寄存 器 。 位 于 x3003 的 指令 将 R3 所 指向 内 存 的 内 容 装 入 R1。 


之 后 ， 开 始 “字符 检查 ”操作 。 首 先是 R1 减 去 数值 4 (EOT 的 ASCIH 码 )， 并 将 结果 装 入 R4。 
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如 果 结 果 是 0， 则 意味 着 到 了 文件 结尾 ， 是 输出 计数 值 的 时 刻 了 。 位 于 x3005 的 指令 条 件 地 跳 转 至 
x300E， 即 输出 计数 值 的 处 理 代码 段 。 

如 果 R4 不 为 0， 则 意味 着 Ri 中 的 字符 是 合法 的 ， 需 要 做 匹配 检查 。 位 于 x3006、x3007 和 x3008 
的 几 行 代码 判断 RO 和 R1 的 内 容 是 否 相 同 ， 即 完成 如 下 的 操作 : 

RO + (NOT(R1)+1) 

只 有 当 R0 和 Ri 的 内 容 完全 相同 时 ， 该 表达 式 的 结果 才 为 0。 如 果 两 者 不 相同 ， 则 x3009 的 条 件 
跳 转 指 令 将 转 至 x300B， 否 则 ( 即 相 同时 )， 则 执行 x300A 的 计数 值 (R2) 增 量 操作 。 

位 于 x300B 的 指令 对 R3 增 量 ， 目 的 是 指向 文件 中 下 一 个 待 检查 的 字符 ， 而 位 于 x300C 的 指令 将 
字符 进一步 装 入 R1 x300D 的 指令 无 条 件 地 跳 转 回 x3004 入 口 ， 开 始 下 一 个 字符 的 处 理 过 程 。 

最 终 当 哨兵 字符 (EOT) 被 检查 到 时 ， 就 开始 计数 值 输出 操作 (位 于 x300E)。 位 于 x300E 的 指 
令 将 00110000 装 人 R0， 而 位 于 x300F 的 指令 将 RO 的 内 容 和 计数 值 (R2) 相 加 ， 该 操作 的 目的 就 是 将 
二 进 制 的 计数 值 (R2) 转换 成 ASCII 表 示 ( 存 入 R0)。 位 于 x3010 的 TRAP 指 令 将 调用 操作 系统 ， 完 
成 对 RO 内 容 的 输出 显示 。 当 事情 都 完成 之 后 ， 位 于 x3011 的 指令 再 次 通过 TRAP 方 式 终止 程序 执行 。 


5.6 总 结 : 数据 通路 (LC-3) 

在 结束 第 5 章 的 内 容 之 前 ， 让 我 们 回顾 一 下 数据 通路 (最初 提 到 它 是 在 第 3 章 的 图 3-33)。 我 们 
将 对 实现 LC-3 的 ISA 的 所 有 结构 做 一 个 详细 的 分 析 ， 其 中 的 大 多 数 已 在 图 5-4、 图 5-5、 图 5-6、 图 5-7、 
图 5-8、 图 5-9、 图 5-11 中 出 现 过 ， 下 面 将 这 些 结构 汇总 在 一 张 图 中 (如 图 5-18 所 示 )。 注 意 ， 图 中 的 
数据 通路 有 两 种 箭头 ;实心 的 和 空心 的 。 实 心 箭头 用 于 被 处 理 信息 ， 而 空心 箭头 用 于 控制 信号 。 注 
意 ， 其 中 的 控制 信号 都 源 自 标 识 为 “Control” 的 模块 ， 但 模块 与 控制 信号 箭头 之 间 的 连接 线 都 未 画 
出 (以 使 图 显得 更 简洁 ) 。 
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图 5-18 LC-3 的 数据 通路 
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5.6.1 数据 通路 的 基本 部 件 


1. 全 局 总 线 

你 一 定 已 经 注意 到 了 ， 两 端 都 是 箭头 的 黑 粗 结构 ， 它 代表 的 就 是 数据 通路 的 全 局 总 线 
(Global Bus) 。LC-3 的 全 局 总 线 包 括 16 根 线 和 相关 的 电子 部 件 ， 它 用 于 一 个 结构 与 另 一 个 结构 之 
间 传 递 最 多 16 个 bit 的 人 信息， 当然， 每 个 结构 还 必须 通过 一 些 必要 的 电子 部 件 才能 连接 到 总 线 上 。 
总 线 上 每 次 只 能 传输 一 个 数据 值 〈 即 任意 时 刻 最 多 只 有 一 个 发 送 者 )。 注 意 ， 每 个 结构 在 向 总 线 输 
送 数据 时 , 其 输入 总 线 第 头 的 后 面 都 有 个 三 角形 , 这 个 三 角形 即 所 谓 的 “三 态 门 ”(tri-state device), 
它 的 作用 就 是 保证 一 个 时 刻 只 有 一 个 数据 提供 者 在 向 总 线 提供 数据 ， 而 对 于 希望 从 总 线 上 获取 这 
个 数据 的 设备 (通常 只 有 一 个 接收 者 ) ， 则 受 控 于 LD.x (load 使 能 ) 信号 (参考 3.4.2 节 的 门 锁 存 器 )。 
但 并 不 是 所 有 的 计算 机 都 只 是 单个 全 局 总 线 ( 即 可 能 存在 多 个 总 线 ) ， 有 关 单 总 线 的 优 缺 点 ， 在 以 
后 的 课程 中 会 有 讨论 。 

2. 内 看 

不 论 是 什么 样 的 计算 机 ， 最 重要 的 部 件 可 能 就 是 内 存 (Memory) 了 。 内 存 中 包含 着 指令 和 数 
据 。 访 问 内 存 的 第 一 步 ， 是 将 被 访问 内 存 的 地 址 装 信 MAR 寄存 器 。 如 果 访 问 操作 是 load， 则 向 内 存 
传送 读 信号 (RD) ， 结 果 是 内 存 将 数据 发 送 至 MDR 寄 存 器 ， 如 果 是 stored 操 作 ， 则 数据 事先 被 存 帮 
在 MDR 寄 存 器 中 ， 然 后 再 向 内 存 传送 写 信号 《WE)， 以 使 得 MDR 输 出 的 数据 被 装 和 人 (MAR) 指定 
的 内 存单 元 。 

3. ALU 和 寄存 器 文件 

ALU 是 信息 处 理 单元 。 它 有 两 个 输入 ， 一 个 来 自 寄 存 器 ， 另 一 个 可 能 来 自 寄 存 器 或 符号 扩展 
的 立即 数 (指令 自身 携带 )。 寄 存 器 文件 (R0~R7) 最 多 可 以 同时 传递 两 个 数值 ， 第 一 个 由 SR1 
(3-bit) 标识 ， 另 一 个 则 由 SR2 标 识 。SR1 和 SR2 都 是 包含 在 指令 中 的 字段 。 第 2 个 操作 数 的 选择 
(寄存 器 或 立即 数 ) 是 由 指令 的 bit[5] 字 段 决 定 的 。 注 意 ，ALU 的 第 2 个 输入 是 由 一 个 开关 (MUX) 
控制 着 的 ， 该 开关 的 控制 信号 (来 自 CONTROL 模 块 ) 事实 上 就 是 指令 的 bit[5]。 

ALU 的 操作 结果 存放 在 通用 寄存 器 之 一 中 ， 会 同时 改变 三 个 条 件 码 位 。ALU 向 总 线 提供 的 是 
16-bit 数 据 ， 具 体 写 入 哪 一 个 寄存 器 ， 是 由 3-bit 的 寄存 器 选择 信号 DR 控制 的 ， 同 时 ALU 的 输出 还 
将 传送 给 LOGIC 模 块 ， 判 断 结果 是 负数 、 零 还 是 正 数 ， 并 由 LOGIC 对 条 件 码 位 做 相应 的 设置 。 

4. PC 和 PCMUX 

PC 通过 总 线 向 MAR 提 供 地 址 信息 ， 读 地 址 是 下 一 个 指令 周期 开始 ( 即 取 指令 节拍 ) 要 获取 的 指 
令 所 在 的 地 址 。 而 PC 本 身 的 输入 则 是 一 个 3 选 1PCMUX 提 供 的 ， 复 用 的 选择 或 切换 取决 于 正在 执行 的 
指令 类 型 。 我 们 知道 在 取 指 令 节拍 ，PC 的 内 容 会 自动 增 量 并 写 回 PC， 如 图 中 PCMUX 的 最 右 端 输入 。 

如 果 当 前 指令 是 一 条 控制 指令 ， 则 被 选中 的 PCMUX 输 入 将 取决 于 控制 指令 的 类 型 (而 不 是 PC 
ABE). 。 如 果 当 前 指令 是 一 条 条 件 跳 转 指令 且 条 件 满 足 ( 即 跳 转 ) ， 则 PC 的 装 和 人 值 是 增 量 PC 和 
PCoffset (IR[8:0] 的 16 位 符号 扩展 ) 的 求 和 。 注 意 ， 这 个 求 和 操作 是 由 专用 的 加 法 器 (而 不 是 ALU) 
完成 的 ， 其 输出 结果 即 为 PCMUX 的 中 间 输 入 。PCMUX 的 第 3 个 输入 来 自 全 局 总 线 ， 在 第 9 和 10 章 
介绍 过 其 他 控制 指令 后 ， 就 会 明白 它 的 使 用 方法 了 。 

5. MARMUX 

如 我 们 所 知 ， 内 存 的 访问 是 通过 向 MAR 寄 存 器 提供 地 址 完成 的 。 而 MARMUX 控 制 信号 的 作 
用 ， 就 是 在 load、store 或 TRAP 的 执行 期 间 ， 为 其 在 两 个 地 址 输入 中 选择 合适 的 输入 。MARMUX 
右边 的 输入 值 是 增 量 PC 或 基 址 寄存 器 与 卫 字 段 内 容 或 0 的 求 和 。 至 于 究竟 是 PC 还 是 基 址 寄存 器 ， 
以 及 究竟 是 哪 几 位 字段 信息 ， 则 取决 于 当前 指令 的 操作 码 。 控 制 信号 ADDR 1MUX 人 负责 选择 PC 或 
基 址 寄存 器 ，ADDR2MUX 人 负责 在 另外 4 个 数值 中 做 选择 。MARMUX 的 左边 输入 是 trapvector 的 零 
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扩展 〈 即 在 不 满 16 位 的 数值 前 填充 0， 补 够 16 位 宽度 ) ， 它 的 使 用 细节 将 在 第 9 章 中 讨论 。 


5.6.2 指令 周期 


最 后 ， 我 们 找 一 个 指令 操作 例子 ， 并 按照 指令 周期 的 执行 顺序 (时间 ) 将 数据 通路 (空间 ) 
复习 一 遍 。 假 设 当 前 PC 内 容 等 于 x3456， 且 地 址 x3456 的 内 容 为 0110011010000100， 而 此 时 LC-3 刚 
刚 完成 x3455 指 令 的 处 理 (假设 是 一 条 ADD 指 令 )， 那 么 下 面 继 续 的 操作 是 什么 ? 

1. FETCH 

指令 执行 的 第 一 步 是 取 指 令 节拍 。PC 寄 存 器 将 提供 访问 内 存 〈( 即 获取 指令 ) 的 地 址 。 在 第 一 
个 时 钟 周期 ，PC 内 容 通 过 全 局 总 线 被 装 人 MAR ， 同 时 PC 自动 增 量 并 装 回 PC。 该 周期 结束 的 时 候 ， 
PC 内 容 等 于 x3457， 然 后 ， 在 下 一 个 周期 (假设 内 存在 一 个 周期 内 返回 信息 ， 而 在 真正 的 机 器 上 要 
数 十 个 周期 )， 内 存 返回 值 0110011010000100 被 装 入 MDR ， 再 下 一 个 周期 ，MDR 内 容 被 转 和 人 IR 寄 
存 器 。 至 此 ， 取 指令 节拍 完成 。 

2. DECODE 

随后 的 一 个 时 钟 周 期 ，IR 的 内 容 被 译 码 ， 即 由 控制 逻辑 产生 对 应 的 一 系列 控制 信号 (空心 箭 
头 )， 挖 制 指 令 的 下 面 操作 过 程 。 由 于 当前 操作 码 是 0110 ( 即 LDR 指 令 )， 这 意味 着 将 采用 “ 基 址 + 
偏 移 ” 的 寻 址 模式 ， 从 内 存 读 取 数据 并 装 入 目的 寄存 器 R3。 

3. EVALUATE ADDRESS 

在 下 一 个 时 钟 周期 ， 开 始 “ 基 址 + 偏 移 ” 的 地 址 计算 。R2 ( 基 址 寄存 器 ) 的 内 容 和 IR[5:0] 的 符 
号 扩展 值 相 加 ， 并 通过 MARMUX 开 关 将 求 和 结果 (地址 值 ) 传人 MAR。 指 令 中 的 SR1 字 段 等 于 
010， 代 表 获 取 基 址 的 寄存 器 是 R2。 另 外 ，ADDRIMUX 控 制 信号 选择 了 SR1IOUT，ADDR2MUX 
冒号 则 选择 了 自 右 向 左 的 第 2 个 输入 源 。 

4. OPERAND FETCH 

在 下 一 个 时 钟 周 期 (或许 更 多 ， 如 果 内 存 访 癌 的 延迟 更 长 的 话 ) ， 该 地 址 内 存单 元 的 数据 被 装 
AMDR, 

5. EXECUTE 

LDR 指 令 不 需要 执行 节拍 ， 所 以 该 节拍 花费 的 时 间 是 0 个 周期 ( 即 直 接 跳 过 )。 

6. STORE RESULT 

最 后 一 个 周期 ，MDR 的 内 容 被 装 入 R3 寄 存 器 。 指令 的 DR 字段 指定 目的 寄存 器 的 编导 为 011 


(R3), 


5.7 习题 


5.14 给 定 指令 ADD、JMP、LEA、NOT， 请 判断 它们 分 别 是 操作 (或 运算 ) 指令 ， 还 是 数据 搬移 
指令 或 控制 指令 ? 对 每 一 条 指令 ， 进 一 步 列 出 该 指令 可 以 采用 的 寻 址 模式 。 
5.2. 如果 内 存 可 寻 址 的 宽度 是 64-bit， 那 么 有 关 MAR 和 MDR 的 大 小 意味 着 什么 ? 
5.3 ”有 两 种 终止 循环 (loop) 的 方法 。 一 种 是 采用 计数 器 控制 循 次 数 ， 另 一 种 是 采用 一 个 被 称 为 
的 “元 素 ” 来 控制 。 MR 
5.4 假设 内 存 包含 256 个 位 置 ， 每 个 位 置 的 宽度 是 16 位 ， 
a. 表达 地 址 的 宽度 至 少 是 多 少 位 ? 
b. 如 果 采 用 PC 相对 寻 址 模式 ， 并 要 求 控 制 指令 能 跳 转 至 20 个 间隔 以 内 的 地 址 处 ， 那 么 跳 转 指 
令 中 要 留 出 多 少 位 的 字段 来 标识 PC 相对 偏 移 (PC-relative offset) ? 
c. 如 果 控 制 指令 所 在 的 地 址 是 3， 那 么 在 LC-3 指 令 中 ， 它 与 地 址 10 之 间 的 PC 偏 移 值 应 该 是 
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5.5 


5.6 


5.7 


5.8 
5.9 





多 少 ? 

a. 什么 是 寻 址 模式 ? 

b. 列举 三 种 指令 操作 数 可 能 存在 的 地 方 。 

c. 列举 LC-3 的 5 种 寻 址 模式 ， 并 指明 各 个 模式 下 操作 数 存在 的 位 置 。 

d. 5.1.2 节 中 的 ADD 指 令 采 用 的 是 什么 寻 址 模式 ? 

回顾 2.7.1 节 中 的 “机 器 忙 ”(machine busy) 例子 。 假 设 BUSYNESS 位 矢量 内 容 存 放 在 R2 寄 
存 器 中 ， 我 们 可 以 采用 LC-3 指 令 “0101 011 010 1 00001 (AND R3，R2，#1)” 判 断 机 器 0 是 
否 忙 (busy)。 如 果 该 指令 的 结果 是 0， 则 意味 着 机 器 0 是 busy 状 态 。 

. 写 一 条 判断 机 器 2 是 否 busy 的 LC-3 指 令 ， 

. 写 一 条 判断 机 器 2 和 机 器 3 是 否 同时 busy 的 LC-3 指 令 ， 

c. 写 一 条 能 够 指示 没有 任何 一 个 机 器 是 busy 的 LC-3 指 令 ， 

d. 你 能 写 一 个 判断 机 器 6 是 否 busy 的 指令 吗 ? 有 什么 问题 吗 ? 

LC-3 的 ADD 指 令 所 能 表达 的 最 大 的 正 整 数 是 多 少 ? 

如 果 我 们 希望 将 ADD 指 令 能 寻 址 的 寄存 器 数 是 增加 到 32 个 ， 有 什么 问题 吗 ? 请 解释 。 

我 们 希望 设计 一 个 “什么 也 不 做 ”的 指令 。 许 多 ISA 都 有 一 个 什么 都 不 做 的 操作 码 ， 通 常 称 
之 为 NOP 指 令 ， 即 “NO OPERATION”。 该 指令 仍然 经 历 取 指令 、 译 码 、 执 行 等 节拍 ， 只 是 
在 执行 节拍 它 什 么 也 不 做 。 下 面 哪 条 指令 可 以 扮演 NOP 的 功能 ， 且 不 影响 程序 的 正常 执行 ? 
a. 0001 001 001 1 00000 

b. 0000 111 000000001 

c. 0000 000 000000000 

甚 中 ADD 指 令 与 其 他 两 条 指令 的 区 别 是 什么 ? 


c om 


5.40 下 面 的 指令 4 和 8 之 间 的 区 别 是 什么 ?它们 之 间 的 相似 性 是 什么 ? 差异 是 什么 ? 


5.11 


5.12 


5.13 


5.14 


5.15 


A 0000111101010101 

B 0100111101010101 
我 们 希望 通过 一 条 指令 的 执行 来 完成 : 将 寄存 器 Ri 的 内 容 减 20， 并 将 结果 保存 在 R2 中 。 能 
做 到 吗 ? 如 果 能 ， 写 出 来 ， 如 果 不 能 ， 请 解释 为 什么 。 
在 执行 完 指令 ADD R2，R0，R1 之 后 ， 我 们 发 现 RO[15] 和 R1[15] 相 同 ， 但 与 R2[15] 不 同 。 已 
知 RO 和 R1 包 含 的 都 是 无 符号 (UNSIGNED) 整数 ( 即 0~65535)， 那 么 在 什么 情况 下 ， 我 们 
可 以 相信 R2 中 的 内 容 ? 
怎样 只 使 用 一 条 指令 就 能 将 R2 的 内 容 移 到 R3 之 中 ? 
LC-3 没 有 提供 减法 指令 。 怎 样 只 使 用 3 条 指令 完成 下 面 的 运算 : RL—R2-R3? 
能 否 只 使 用 一 条 LC-3 指 令 ， 且 不 影响 任何 寄存 器 的 内 容 ， 基 于 R1 的 内 容 设 置 条 件 码 ? 
. 是 否 能 通过 一 组 指令 序列 的 执行 ， 使 得 最 后 3 个 条 件 码 分 别 为 N=1、Z=1、P=0? 请 解释 。 
. 写 一 条 能 够 清除 R2 内 容 的 指令 。 
LC-3 没 有 提供 对 应 于 逻辑 OR 的 操作 码 。 换 句 话 说 ， 不 存在 能 够 执行 OR 操作 的 LC-3 指 令 ，。 
但 我 们 可 以 通过 一 组 指令 来 完成 等 价 的 OR 功能 。 以 下 4 条 指令 的 任务 是 将 R1 和 R2 的 内 容 相 
或 (OR)， 并 将 结果 保存 在 R3 中 。 试 填写 下 面 空缺 的 指令 ， 
(1) 1001 100 001 111111 


(2) 
(3) 0101 110 100 000 101 


(4) 
阅读 程序 ， 请 写 出 下 面 起 始 于 x3100 的 程序 结束 后 (HALT)， 寄 存 器 R1、R2、R3、R4 的 内 容 。 


?£R9c» 
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地 址 数据 值 
0011 0001 0000 0000 1110 001 000100000 
0011 0001 0000 0001 0010 010 000100000 
0011 0001 0000 0010 1010 011 000100000 
0011 0001 0000 0011 0110 100 010 000001 
0011 0001 0000 0100 1111 0000 0010 0101 
0011 0001 0010 0010 0100 0101 0110 0110 
0011 0001 0010 0011 0100 0101 0110 0111 
0100 0101 0110 0111 1010 1011 1100 1101 
0100 0101 0110 1000 1111 1110 1101 0011 





516 在 以 下 情况 中 ，LC-3 的 哪 一 种 寻 址 模式 是 最 合适 的 (可 能 有 多 个 正确 答案 ， 所 以 请 为 你 的 


5.17 


5.18 


5.23 


答案 做 出 解释 ) ? 

a. 读 取 从 间距 不 超过 土 2 的 地 址 的 内 容 ， 

b. 读 取 从 间距 超过 2 的 地 址 的 内 容 ， 

c. 读 取 一 个 连续 存放 的 数组 内 容 。 

在 LD 指令 的 执行 过 程 中 ， 共 有 多 少 次 读 写 内 存 的 操作 ? LDI 指 令 有 多 少 次 LEA 指令 呢 ? 我 
们 说 的 操作 包括 指令 周期 的 所 有 节拍 。 

假设 当前 PC 指向 一 个 LDR 指 令 所 在 的 地 址 。 如 果 让 LC-3 处 理 访 指 令 ， 则 需要 多 少 次 内 存 访 
间 ? STIRITRAPHWE? 

LC-3 的 指令 寄存 器 (IR) 由 16 个 bit 组 成 ， 其 中 bit[8:0] 表 示 LD 指 令 的 PC 偏 移 值 。 如 果 我 们 对 
ISA 做 出 修改 ， 让 bit[6:0] 表 示 PC 偏 移 值 ， 则 LD 指令 读 取 数 据 的 可 寻 址 范围 是 多 大 ? 

如 果 我 们 设计 LC-3 的 ISA， 让 LD 指令 只 能 从 距离 增 量 PC 不 超过 土 32 的 地 址 读 取 数 据 ， 则 LD 
指令 中 的 PC 偏 移 字段 需要 多 少 个 bit? 

LC-3 的 ISA 最 多 支持 多 少 个 TRAP 服 务 ? 请 解释 。 

PC 内 容 为 x3010。 以 下 内 存单 元 的 内 容 如 下 所 示 : 


x3050: x70A4 
x70A2: x70A3 
x70A3 ` xFFFF 
Xx70A4 x123B 

下 面 三 条 指令 的 执行 导致 R6 装 入 一 个 数值 ， 问 该 数值 是 多 少 ? 
x3010 1110 1110 0011 0001 
x3011 0110 1000 1100 0000 
x3012 0110 1101 0000 0000 

能 否 用 一 条 指令 就 完成 上 面 三 条 指令 所 完成 的 任务 ? 

假设 下 面 指令 被 装 入 x30FF， 

x30FF 1110 0010 0000 0001 
x3100 0110 0100 0100 0010 
x3101 1111 0000 0010 0101 
x3102 0001 0100 0100 0001 
x3103 0001 0100 1000 0010 


请 问 程序 执行 完 之 后 ，R2 的 内 容 是 什么 ? 
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5.26 


5.27 


5. 


N 


8 


5.29 


5. 


UJ 


0 


5. 


UU 


1 


101 


位 于 x3200 的 一 条 LDR 指 令 ， 采 用 R4 做 它 的 基 址 寄存 器 。R4 当 前 的 内 容 是 x4011。 问 该 指令 
读 取 数 据 的 最 大 可 寻 址 地 址 是 多 少 ? 再 假设 我 们 重新 定义 LDR 的 偏 移 值 是 0 扩展 的 (而 不 是 
符号 扩展 ) ， 则 该 指令 最 大 可 寻 址 地 址 是 多 少 ? 最 小 地 址 呢 ? 

写 一 个 LC-3 程 序 ， 比 较 R2 和 R3 的 内 容 ， 并 将 最 大 值 放 人 有 R1I 寄 存 器 。 如 果 两 个 数 相 同 ， 则 R1 
等 于 0。 

给 你 一 个 任务 ， 设 计 下 一 代 的 LC-3。 要 求 是 : 为 ISA 增 加 16 个 新 指令 ， 并 将 寄存 器 组 的 数目 . 
从 8 个 增加 至 16 个 。 机 器 要 具备 1 个 字 节 的 基本 寻 址 能 力 ， 且 内 存 寻 址 空间 大 小 为 64K 字 节 。 
指令 的 大 小 仍然 是 16-bit。 指 令 的 格式 如 原来 的 16 位 格式 一 样 ， 具 有 相同 的 5 个 字段 ， 只 是 你 
可 以 适当 地 调整 各 个 字段 的 宽度 。 问 ， 

a. PC 的 宽度 至 少 是 多 少 位， 才能 保证 访问 整个 地 址 空间 ? 

b. 运算 指令 中 ， 可 表达 的 最 大 立即 数 是 多 少 ? 

c. 如 果 我 们 需要 TRAP 指 令 提供 128 个 操作 系统 服务 程序 ， 且 通过 将 trapvector 左 移 5 位 ， 直 接 
形成 这 些 服务 程序 的 入 口 地 址 ， 试 计算 一 下 这 些 服务 程序 所 需要 占用 的 最 小 内 存 大 小 。 

d. 如 果 在 新 的 LC-3 中 ， 我 们 将 寄存 器 数目 从 8 个 减 至 4 个 ， 但 操作 码 数 目 仍 然 保 持 为 16 个 ， 
试问 在 新 的 机 器 上 ，ADD 指 令 所 能 表示 的 最 大 立即 数值 是 多 少 ? 

如 果 在 5.3.5 节 的 7 行 代码 的 例 程 执行 之 前 ，R2 的 内 容 为 xAAAA。 那 么 在 7 条 指令 的 执行 过 程 
中 ，R2 的 内 容 共 有 多 少 种 数值 ? 列举 出 来 。 

事实 上 我 们 “确实 ”没有 必要 提供 “load indirect (1010)” 和 “store indirect (1011)” 指 令 ， 
因为 我 们 可 以 通过 其 他 指令 的 组 合 来 完成 相同 的 任务 。 试 用 一 组 指令 序列 替换 下 面 程序 中 的 
store 操 作 (1011), 


x3000 0010 0000 0000 0010 
x3001 1011 0000 0000 0010 
x3002 1111 0000 0010 0101 
x3003 0000 0000 0100 1000 
x3004 1111 0011 1111 1111 


LC-3 有 一 个 指令 “LDR DR, BaseR, offset”。 在 这 个 指令 被 译 码 之 后 ， 则 产生 下 面 一 些 操作 
(或 称 为 “ 微 指令 ”(microinstruction ) ) : 


MAR + BaseR + SEXT(Offset6) ; set up the memory address 
MDR «— Memory [MAR] ; read mem at BaseR + offset 
DR < MDR ; load DR 


假设 LC-3 要 引入 一 个 新 指令 “MOVE DR，SR”， 即 将 地 址 为 SR 的 内 存单 元 内 容 拷贝 至 
地 址 为 DR 的 内 存单 元 。 问 ;: 
a. MOVE 指 令 并 不 是 必需 的 ， 因 为 它 能 完成 的 工作 通过 LC-3 现 有 的 一 组 代码 组 合 也 可 以 完 
成 (又 称 为 仿真 emulate))。 试 写 出 (RHA) "MOVE RO0，R1” 指 令 的 LC-3 代 码 ， 
b. 如 果 LC-3 真 的 添加 了 MOVE 指 令 ， 试 写 出 它 的 微 指令 序列 (从 译 码 完 成 之 后 开始 )。 
下 面 表格 显示 的 是 LC-3 内 存 的 部 分 内 容 : 


地 ht 数据 d 
0011 0001 0000 0000 1001 001 001 111111 
0011 0001 0000 0001 0001 010 000 000 001 
0011 0001 0000 0010 1001 010 010 111111 
0011 0001 0000 0011 i 0000 010 111111100 


如 果 其 中 的 条 件 跳 转 指令 又 跳 转 至 x3100， 那 么 ， 你 能 推测 出 有 关 R0O 和 R1 的 什么 信息 ? 
如 图 所 示 是 8 个 寄存 器 在 x1000 指 令 执行 之 前 和 执行 之 后 的 快照 (snapshot) ， 试 通过 寄存 器 
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的 变化 对 比 ， 推 测 该 指令 是 一 条 什么 指令 (填空 ) ? 


执行 前 执行 后 
RO x0000 RO x0000 
Ri x1i11 R1 xllil 
R2 x2222 R2 x2222 
R3 x3333 R3 x3333 
RA x4444 R4 x4444 
R5 x5555 R5 xFFF8 
R6 x6666 R6 x6666 
R7 X7777 R7 x7717 


0x1000: 0 0 0 1] 


532 假设 在 下 面 代码 序列 执行 之 前 ， 条 件 码 的 值 为 N=0，Z=0，P=1。 问 执行 之 后 ， 它 们 的 值 是 


多 少 ? 
x3050 0000 0010 0000 0001 
x3051 0101 0000 0010 0000 
x3052 0001 0000 0010 0001 
5.33 ”如 果 下 面 代码 执行 之 后 R90 的 内 容 为 5， 试 推测 有 关 R5 的 内 容 会 是 怎样 的 。 
x3000 0101 1111 1110 0000 
x3001 0001 1101 1110 0001 
x3002 0101 1001 0100 0110 
x3003 0000 0100 0000 0001 
. x3004 0001 0000 0010 0001 
x3005 0001 1101 1000 0110 
x3006 0001 1111 1110 0001 
x3007 0001 0011 1111 1000 
x3008 0000 1001 1111 1001 
x3009 0101 1111 1110 0000 


5.34 ”基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 5-4 中 与 NOT 指 令 执行 相关 的 功能 单元 。 
5.35 ”基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 5-5 中 与 ADD 指 令 执 行 相关 的 功能 单元 。 
5.36 ”基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 5-6 中 与 LD 指 令 执行 相关 的 功能 单元 。 
5.37 ”基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 5-7 中 与 LDI 指 令 执行 相关 的 功能 单元 。 
5.38 基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 $-8 中 与 LDR 指 令 执 行 相关 的 功能 单元 。 
5.39 基于 图 5-18 画 出 的 全 部 数据 通路 ， 指 出 图 5-9 中 与 LEA 指 令 执行 相关 的 功能 单元 。 
5.40 图 $-19 中 所 示 是 LC-3 的 局 部 图 ， 试 回答 标识 为 A 的 信号 的 作用 是 什么 ? 

15 0 








图 5-19 题 5.40 的 图 
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图 5-20 所 示 是 LC-3 的 局 部 实现 逻辑 。 











图 5-20” 题 5.41 的 图 


a. 信号 了 提供 的 是 什么 信息 ? 

b. 信号 X 是 锁 存 器 D 的 “ 门 控 ”(gated) 信和 号， 请 问 X 信 号 的 产生 逻辑 是 否 存在 错误 ? 
LC-3 开 发 组 (macho-company) 决定 利用 备用 的 操作 码 1101 实 现 一 个 新 指令 。 他 们 要 在 下 面 
的 各 个 候选 中 ， 挑 选 一 个 最 合适 的 : 

a. MOVE Ri,Rj， 将 Rj 的 内 容 找 贝 至 Ri， 

b. NAND Ri,Rj,Rk，Ri 是 Rj 和 Rk 的 按 位 (bit-wise) NAND 结 果 ， 

c. SHFL Ri,Rj,#2，Rj 内 容 左 移 2 位 的 结果 存 人 Ri 

d. MULRiRjRk; - 

你 的 答案 是 什么 〈 你 觉得 哪个 更 合适 、 更 有 必要 ) ? 


第 6 章 m — 


现在 我 们 开始 学 习 编 程 方 法 ， 即 通过 编程 方式 让 计算 机 为 我 们 解决 问题 。 本 章 我 们 要 学 两 个 
WARS 一 是 构建 程序 的 方法 ， 二 是 修补 这 些 程序 的 方法 。 如 果 程 序 刚 编写 完 就 运行 ， 难 免 会 出 现 
一 些小 问题 (习惯 上 ， 我 们 称 之 为 “ 跨 虫 ”或 bug)， 而 消除 这 些 错 误 的 操作 则 被 称 做 “调试 ” 
(debugging)。 由 于 引发 bug 的 因素 很 多 ， 所 以 调试 程序 所 花费 的 时 间 通 常会 远 远大 于 编写 代码 所 花 
的 时 间 。 


6.1 问题 求解 


6.1.1 系统 分 解 


在 第 1 章 中 ， 我 们 阐述 了 这 样 一 个 模型 : 为 了 让 电子 〈 即 电子 器 件 和 电路 ) 能 帮 有 我 们 解决 问题 ， 
必须 经 历 从 自然 语言 的 问题 描述 到 使 控制 电路 工作 的 多 层 转换 。 例 如 ， 首 先 用 自己 熟悉 的 语言 
(英语 或 其 他 你 熟悉 的 语言 ， 如 意大利 语 、 汉 语 (Mandarin)、 印 度 语 (Hindi) 等 ) 将 问题 描述 清 
楚 ， 然后 ， 再 将 它 转换 成 算法 (algorithm)， 即 具备 了 算法 的 三 个 定义 特性 的 过 程 描述 ; (1) AR 
性 (可 终止 的 ); (2) 确定 性 〈 每 个 步骤 都 是 精确 的 、 无 二 义 性 的 )，(3) 可 计算 性 (每 个 步骤 都 是 
计算 机 可 操作 的 )。 

在 20 世 纪 60 年 代 后 期 ， 提 出 了 “结构 化 编程 ”(structured programming) 的 概念 。 其 目的 是 使 
得 多 个 程序 员 可 以 共同 承担 一 个 复杂 问题 的 求解 任务 ， 即 将 问题 系统 地 分 解 成 多 个 独立 的 、 足 够 
小 的 模块 或 单元 ) ， 同 时 要 求 这 些小 单元 具备 可 被 每 个 程序 员 独 立 编程 实现 和 运行 的 特性 〈 即 不 
依赖 其 他 模块 ， 即 可 独立 运行 以 验证 其 正确 性 ) ， 我 们 又 称 该 机 制 为 “系统 分 解 ”(System atic 
decomposition) ， 即 一 个 大 任务 被 分 解 成 了 多 个 子 任 务 的 集合 。 

下 面 我 们 将 体会 到 ， 系 统 分 解 模型 是 用 计算 机 编程 求解 复杂 问题 的 一 个 重要 方法 。 


6.1.2 三 种 结构 ， 顺序 、 条 件 、 循 环 


系统 分 解 的 原则 是 : 将 一 个 任务 即 一 个 完整 的 工作 单元 (如 图 6-1a 所 示 )， 分 割 成 多 个 更 小 的 
工作 子 单元 ， 且 这 些 工 作 子 单元 合 起 来 所 能 完成 的 任务 ， 和 原先 单个 大 工作 单元 是 相同 的 。 其 思 
想 是 从 一 个 很 大 的 、 复 杂 的 任务 开始 ， 将 其 分 解 成 若干 个 子 任 务 ， 再 将 每 个 子 任务 进一步 分 解 成 
更 小 的 任务 ， 如 此 反复 ， 直 到 足够 小 ， 即 小 到 方便 编程 实现 。 我 们 称 这 个 过 程 为 “逐步 细 化 ”。 

分 解 后 的 子 任务 (模块 ) 将 基于 特定 的 “结构 ”(construct) 有 机 地 结合 在 一 起 ， 完 成 更 大 的 
任务 目标 。 最 常见 的 基本 构建 方法 是 顺序 、 条 件 和 循环 这 三 种 结构 。 

顺序 结构 (sequential construct) 的 使 用 场景 如 图 6-1b 所 示 ， 一 个 任务 被 分 解 成 两 个 子 任务 ， 
且 两 个 子 任务 的 执行 关系 是 顺序 的 ， 即 第 1 个 子 任务 完成 之 后 ， 再 接着 做 第 2 个 子 任务 。 从 另 一 种 
角度 来 解释 ， 即 意味 着 两 个 子 任 务 都 一 定 要 执行 ， 且 第 2 个 子 任务 一 旦 开始 执行 ， 就 决 不 会 再 返回 
至 第 1 个 子 任务 。 

条 件 结构 (conditional construct) 的 使 用 场景 如 图 6-1c 所 示 ， 一 个 任务 被 分 解 成 两 个 子 任务 ， 
但 两 者 之 中 有 且 仅 有 一 个 会 被 执行 。 具 体 是 哪 一 个 被 执行 ， 取 决 于 “条 件 ” 的 状态 ， 即 车 条 件 为 
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"A" (true) 则 执行 这 个 子 任务 ， 若 条 件 为 “ 假 ”(false) 则 执行 另 一 个 子 任 务 。 注 意 ， 其 中 的 任 
何 一 个 子 任务 都 可 能 为 空 《vacuous)， 即 什么 也 不 做 (do hothing)。 无 论 如 何 ， 一 旦 其 中 的 一 个 子 
任务 执行 完毕 ， 程 序 就 离开 这 里 ， 进 入 后 面 的 环节 ， 即 程序 不 会 回头 或 重新 测试 条 件 。 


等 待 被 分 解 的 任务 





执行 第 1 部 分 任务 
执行 第 2 部 分 任务 


b) 顺序 执行 方式 c) 条 件 执行 方式 d) 反复 执行 方式 
图 6-1 结构 化 编程 的 基本 构造 式 


柱 环 结构 (iterative construct) 的 使 用 场景 如 图 6-1d 所 示 ， 我 们 希望 一 个 子 任务 能 被 重复 执行 
多 遍 ， 不 断 循环 ， 直 到 特定 条 件 不 再 为 “ 真 "。 换 旬 话 说 ， 子 任务 每 完成 一 次 ,将 再 次 返回 并 重新 
测试 条 件 。 若 条 件 满足 ( 即 为 “ 真 ")， 则 再 次 执行 同一 任务 ， 若 不 满足 ， 则 程序 继续 进入 下 一 个 
环节 。 

图 6-1a 中 ， 方 框 代表 一 个 任务 ， 顶 部 的 第 头 代表 进入 该 任务 〈 即 任务 开始 ) ， 底 部 箭头 代表 任 
务 结束 。 我 们 并 没有 提 及 方 框 内 的 任务 究竟 是 个 什么 任务 ， 但 它 总 是 可 以 被 下 面 三 种 之 一 的 结构 
所 表示 并 替代 的 。 注 意 ， 无 论 是 图 6-1a 还 是 它 的 替代 者 〈 如 图 6-1b、c 或 d) ， 它 们 都 具备 一 个 重要 
特征 ， 即 “ 单 入 口 ”(one entrance into the construct) 和 “ 单 出 口 ” (one exit out of the construct), 


下 面 我 们 将 通过 例子 解释 系统 分 解 的 方法 。 
6.1.3 实现 三 种 结构 的 LC-3 指 令 — 


在 讲解 例子 之 前 ， 我 们 先 介绍 LC-3 中 与 三 种 结构 分 解 方 法 相关 的 指令 (如 图 6-2 所 示 )。 其 中 ， 
图 6-2b>、c、d 所 示 的 控制 指令 分 别 对 应 于 图 6-1b、c、d 所 示 的 三 种 结构 。 

图 6-2 中 的 大 写字 母 4、8、C、D 代 表 LC-3 代 码 的 不 同 入 口 地 址 。 比 如 在 三 个 例子 中 都 出 现 的 
“4”， 代 表 的 就 是 第 一 条 执行 指令 的 入 口 。 

图 6-2b 描 述 的 是 顺序 类 型 分 解 方法 的 控制 流 。 注 意 ， 其 中 不 需要 控制 指令 的 存在 ， 因 为 PC 会 
自动 增 量 ( 即 从 B, 转 至 B+1)， 程 序 继续 执行 直到 D,。 它 不 会 返回 第 1 个 子 任务 。 

图 6-2c 描 述 的 是 条 件 类 型 分 解 方法 的 控制 流 。 首 先是 条 件 的 产生 ， 即 设置 某 个 条 件 码 。 位 于 地 
址 B8, 的 条 件 跳 转 指令 对 该 条 件 码 做 测试 , 如 果 条 件 为 真 , 则 PC 被 设置 为 地 址 C2+1 ( 即 执行 子 任务 1)。 
如 果 条 件 为 假 , 则 PC ( 跳 转 指令 的 取 指 令 阶段 已 自动 增 量 ) 从 地 址 D+1 读 取 指 令 ( 即 执行 子 任务 2)。 
子 任务 2 的 结束 指令 (地址 C,) 是 一 条 无 条 件 跳 转 指 令 ， 跳 转 至 D+1 (注意 ; x 对 应 的 是 子 任务 2 的 





106 #6 Žž 


指令 数目 ，y 对 应 的 是 子 任务 1 的 指令 数目 )。 


) 
A A 
第 1 个 子 任务 
等 待 被 分 解 的 B, 
任务 有 ,+1 
wi Di 


a) 





图 6-2 与 结构 化 编程 相关 的 LC-3 指 令 


图 6-2d 描 述 的 是 循环 类 型 分 解 方 法 的 控制 流 。 与 条 件 类 型 控制 流 相同 的 是 ， 开 始 处 是 条 件 生成 
代码 (设置 条 件 码 )， 然 后 是 执行 条 件 跳 转 指令 ， 在 这 里 ， 位 于 地 址 B8; 指 令 中 的 条 件 位 被 设置 了 ， 即 
意味 着 如 果 条 件 为 假 ， 则 条 件 跳 转 至 Dyt+1。 相 反 ， 只 要 条 件 持 续 为 真 ， 则 PC 增 量 为 By+1 (执行 惟一 
的 子 任务 )。 子 任务 的 结束 处 (地 址 D;) 是 一 条 无 条 件 跳 转 指令 ， 即 设置 PC 为 4， 再 次 生成 和 测试 条 
件 码 (注意 ; z 对 应 于 图 6-2d 中 子 任务 的 指令 数目 ，w 对 应 于 图 6-2d 中 整个 分 解 代码 的 指令 数目 )。 

下 面 我 们 开始 例子 的 分 析 。 


6.1.4 回顾 字符 数 统计 例子 


回顾 5.5 节 中 对 问题 的 描述 ; “在 一 个 文件 中 统计 特定 字符 出 现 的 次 数 。 该 特定 字符 是 由 键盘 输 
和 人 确定 的 ， 统 计数 结果 将 回 显 在 屏幕 上 ”。 对 这 个 自然 语言 问题 摘 述 的 系统 分 解 如 图 6-3 所 示 ， 问 题 
的 简要 描述 如 图 6-3a 所 示 。 

为 了 更 好 地 解决 问题 ， 我 们 必须 首先 明确 问题 的 目标 是 什么 ， 以 及 有 哪些 方法 可 以 解决 这 个 
问题 。 本 例 的 问题 描述 告诉 我 们 ， 从 键盘 读 取 我 们 感 兴趣 的 字符 ， 然 后 检查 某 个 文件 的 所 有 字 
符 ， 统 计 我 们 感 兴趣 的 这 个 字符 在 文件 中 出 现 的 次 数 ， 最 后 将 统计 结果 输出 。 

另外 ， 我 们 还 需要 一 个 文件 扫描 机 制 和 计数 器 (用 于 每 次 匹配 成 功 时 ， 增 量 该 计数 器 )。 

同时 ， 我 们 还 需要 一 些 空间 或 位 置 ， 存 放下 面 的 信息 (与 扫描 机 制 和 计数 器 相关 的 )， 

(1) 来 自 键盘 的 输入 字符 。 

(2) 指向 被 扫描 文件 当前 扫描 位 置 (或 偏 移 ) 的 指针 。 

(3) 文件 中 正在 被 扫描 的 字符 值 。 

(4) 被 匹配 字符 出 现 的 次 数 。 

此 外 ， 我 们 还 需要 一 种 机 制 来 判断 文件 是 否 结束 。 

因此 ， 该 问题 很 自然 地 (采用 顺序 结构 ) 被 分 解 为 三 个 部 分 (如 图 6-3b 中 A4、B、C 所 示 ): A 
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阶段 初始 化 ， 包 括 从 键盘 读 取 待 匹 配 字符 ，B 阶 段 统计 文件 中 特定 字符 出 现 次 数 的 具体 操作 ，C 阶 
段 显示 统计 结果 。 


初始 化 ， 将 各 个 初始 值 分 别 
放 人 各 个 位 置 


输入 一 个 字符 
CIRMI, eaa 
文件 的 

-ALERTAR -NER 
,将 存放 计数 值 的 寄存 器 清 


空 


扫描 文件 ， 一 个 接 一 个 地 定 
位 ， 如 果 匹 配 则 计数 值 加 1 


输入 字符 ， 然 后 扫描 文件 ， 
并 记录 该 字符 出 现 的 次 数 ， 


最 后 ， 在 显示 器 上 显示 该 字 


b) 





图 6-3 字符 数 统计 程序 的 逐步 细 化 过 程 


前 面 的 很 多 例子 都 表明 了 初始 化 过 程 的 重要 性 。 在 程序 的 主体 运行 之 前 ， 必 须 确保 其 中 的 变 
量具 有 如 我 们 所 期 望 的 初始 值 (否则 会 出 现 意 想不到 的 运行 错误 )。 这 些 初始 值 不 会 自己 神奇 地 出 
现在 GPR 寄 存 器 中 (注意 ， 无论 变量 事先 是 在 内 存 还 是 在 GPR 中 ， 最 终 在 运算 时 刻 都 会 转 人 GPR ) 。 
从 另 一 种 角度 来 看 : 初始 化 本 身 就 是 算法 的 一 个 明确 步骤 ， 即 所 有 算法 的 第 一 个 步 又 。 

在 本 算法 中 ( 见 第 5 章 ) ， 初 始 化 工作 包括 : 计数 器 清 0， 设 置 指针 指向 被 检查 文件 的 第 一 个 字 
符 ， 从 键盘 读 取 待 匹配 字符 ， 以 及 从 文件 中 读 取 第 一 个 字符 。 总 体 上 ， 这 4 个 操作 构成 了 算法 的 初 
始 化 步骤 〈 如 图 6-3b 中 的 模块 A) 。 

如 图 6-3c 所 示 ， 模 块 B 又 被 进一步 地 分 解 成 了 “循环 结构 " 。 每 循环 一 次 ， 检 查 文 件 的 一 个 字 
符 ， 如 此 反复 。B1 描 述 的 是 每 次 循环 所 做 的 事情 : 测试 字符 并 增 量 计数 器 (如 果 匹 配 的 话 ) ， 然 后 
读 入 下 一 个 字符 ， 为 下 次 循环 做 准备 。 如 第 5 章 所 述 ， 控 制 循环 次 数 的 方法 有 两 种 :哨兵 法 和 计数 
器 法 。 本 程序 采用 的 是 哨兵 法 ， 即 以 ASCH 字 符 EOT (End of Text) 作为 哨兵 , 一旦 发 现 它 ， 就 音 
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味 着 文件 结束 了 。 换 名 话说， 以 文件 读 人 字符 是 否 是 EOT 字 符 来 判断 是 否 是 合法 字符 。 










R2 «- 0 (count) 


RO <- input from the keyboard 
R3 «- address of first char in the file 
R1 «- first char in the file 


A1 


.| R2 <- 0 (count) 
RO «- input from the keyboard 










R3 «- address of first char in the file A2 
R1 «- first char in the file 





A3 





A4 


B1 


测试 字符 。 如 果 匹 配 ， 则 
RIEAN, 总和 下 一 个 
子 -不 


一 一 一 一 一 一 一 一 


一 一 一 一 一 -一 一 一 一 一 一 一 = 





图 6-3 字符 数 统计 程序 的 逐步 细 化 过 程 ( 续 ) 


图 6-3c 给 出 了 子 任务 A 初始 化 过 程 的 详细 描述 : LC-3 的 4 个 寄存 器 (RO, R1, R2, R3) 分 别 
扮演 了 算法 中 的 4 个 重要 元 素 : 键盘 输入 字符 、 当 前 被 测试 字符 (来自 文 件 )、 计 数 器 、 指 向 下 一 
个 待 测试 字符 的 指针 。 

图 6-3d 采 用 顺序 结构 分 解 了 Bl 和 C。 其 中 ，B1 被 分 解 为 B2 和 B3，B2 负 责 测试 当前 字符 ， 如 果 
匹配 ， 则 增 量 计数 器 ，B3 则 负责 获取 下 一 个 待 检查 字符 。C 也 被 分 解 成 C1 和 C2，C1 人 负责 将 计数 器 
值 从 补 码 整 数 转换 成 ASCH 码 ，C2 负 责 输 出 ASCH 码 计数 值 。 

图 6-3e 完 成 最 后 一 步 分 解 ， 即 将 B2 细 化 成 一 个 条 件 结构 ， 将 B3 细 化 为 一 个 顺序 结构 ( 即 指针 
增 量 ， 并 从 文件 中 装 和 下 一 个 待 检 查 字符 )。 

最 后 一 步 是 最 容易 的 一 步 ， 是 将 图 6-3e 中 每 个 细 化 后 的 方 框 即 子 任务 写成 LC-3 的 代码 。 注 意 ， 
图 6-3e 本 质 上 和 图 5-7 是 完全 一 样 的 (惟一 不 同 的 ， 是 这 个 图 的 形成 过 程 )。 

在 结束 本 话题 之 前 值得 一 提 的 是 ， 现 实 中 你 不 可 能 一 下 子 就 能 将 每 一 样 事情 都 搞 明 白 ， 即 设 
计 出 如 图 6-3e 这 样 清晰 的 分 解 描述 。 如 果 遇 到 这 种 情况 , 不 要 放弃 ! 你 可 以 先 从 最 容易 的 地 方 下 手 ， 
然后 逐渐 清晰 和 细 化 。 解 决 问题 就 如 同 猜 迷 ， 开 始 一 定 很 没 头 绪 ， 但 尝试 得 越 多 就 越 清 楚 ， 最 终 
就 把 问题 给 解决 了 。 当 你 最 终 明 白 “ 已 知 哪些 ”(what is given)、“ 要 做 什么 ”(what is being asked 
for) 以 及 “该 怎样 做 ” (how to proceed) 之 后 ， 再 回 到 方 框图 阶段 (如 图 6-3a) ， 然 后 重新 开始 问 
题 的 系统 分 解 过 程 。 
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A1 | R2 «- 0 (计数 值 ) 










A3 






R3 <- 起 始 地 址 


R1 <- 第 一 个 字符 





A4 









No 


Yes em 
R2 <- R2 +1 | 





=.. -m-i 


e) 
图 6-3 字符 数 统计 程序 的 逐步 细 化 过 程 (HR) 


6.2 调试 


“调试 ”(debugging) 可 能 是 再 常见 不 过 的 事情 了 (我 们 称 之 为 “common sense"), fiu, f 
驱车 前 往 一 个 从 来 没有 去 过 的 地 方 ， 并 且 在 某 个 路 口 做 了 一 个 错误 的 拐弯 。 那 么 你 该 怎么 办 ? 最 
普通 的 “驾驶 调试 ”(driving debugging) 方法 是 漫 无 目的 地 乱 诞 ， 试 图 发 现 返 回 的 道路 。 如 果 这 
样 也 失败 了 ， 你 可 能 会 听取 旁人 的 意见 ， 你 不 停 地 转圈 ， 最 终 回 到 你 “知道 ”的 一 个 来 路 上 ， 同 
样 ， 你 也 可 能 会 取出 地 图 ， 按 照 方向 指示 ， 对 比 你 的 位 置 (如 从 窗外 的 路 标 上 获知 ) 和 图 上 的 标 
识 ， 按 照 地 图 指示 到 达 目 的 地 (当然 这 对 很 多 人 来 说 有 难度 )。 

程序 调试 和 驾驶 经 历 很 相似 ， 程 序 中 存在 的 一 个 逻辑 错误 如 同 你 拐 错 的 一 个 弯 。 最 简单 的 办 
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法 是 通过 程序 跟踪 找到 你 的 位 置 ， 跟 踪 内 容 包括 指令 执行 顺序 及 每 条 指令 的 执行 结果 。 通 过 对 执 
行 序列 的 跟踪 ， 可 以 发 现 控制 流 方面 的 错误 (如 跳 转 到 不 该 被 执行 的 代码 序列 ) ， 对 每 条 指令 执 
行 结 果 的 检查 ， 可 以 发 现 程序 中 的 逻辑 错误 。 一 名 话 ， 当 你 发 现 程序 执行 的 任何 行为 和 状态 与 所 
期 望 的 不 同时 ， 那 么 就 知道 程序 出 现 bug 了 。 

解决 问题 的 有 效 办 法 之 一 ， 是 将 程序 分 割 成 多 个 模块 ， 并 在 每 个 模块 执行 结束 时 检查 计算 结 
果 。 事 实 上 ， 结 构 化 的 编程 方法 (6.1 节 ) 更 方便 部 署 检查 点 ， 同 样 也 能 更 系统 地 确定 故障 点 ， 从 
而 将 注意 力 集中 在 最 可 能 发 生 错误 的 地 方 〈 而 不 是 瘟 无 目的 地 查找 ) 。 


6.2.1 调试 的 基本 操作 


现在 已 有 很 多 成 熟 的 调试 工具 ， 在 未 来 的 几 年 里 ， 你 将 接触 其 中 的 许多 工具 。 在 第 15 章 中 ， 
我 们 将 学 习 dbx (一 个 C 语 言 源码 级 调试 器 ) 所 提供 的 一 些 调试 技术 ， 但 现在 ， 我 们 还 是 想 在 机 器 
结构 层面 (而 不 是 类 似 C 的 高 级 语言 层次 ) ， 借 助 基本 的 交互 式 调试 做 些 事情 。 所 谓 “ 交 互 式 调试 ”， 
就 是 用 户 坐 在 键盘 和 显示 器 前 面 ， 可 以 向 计算 机 发 送 命令 。 在 我 们 的 例子 中 ， 采 用 的 调试 器 就 是 
LC-3 模 拟 器 (simulator)， 我 们 可 以 通过 该 模拟 器 提供 的 菜单 与 之 交互 。 

此 时 需要 完成 以 下 重要 操作 : 

(1) 对 内 存单 元 和 寄存 器 赋值 。 

(2) 执行 程序 的 指令 序列 。 

(3) 在 任意 时 刻 中 止 执行 。 

(4) 在 任意 执行 步骤 ， 查 看 内 存 和 寄存 器 的 内 容 。 

这 些 操作 虽然 基本 ， 但 基于 它们 可 以 完成 很 多 调试 任务 。 

1. 赋值 

直接 对 内 存 或 寄存 器 赋值 的 能 力 非常 重要 。 我 们 可 以 跳 过 之 前 的 代码 执行 〈 即 直接 从 需要 调 
试 的 代码 处 开始 )， 而 直接 将 内 存 和 寄存 器 的 内 容 设 置 为 我 们 期 望 的 (如 同 执行 过 之 前 代码 一 样 )。 
这 样 就 使 得 我 们 可 以 孤立 地 测试 部 分 代码 ， 而 不 需要 “麻烦 ”地 执行 之 前 的 代码 。 假 设 程序 中 的 
某 个 模块 首先 从 键盘 获取 输入 ， 之 后 的 模块 将 对 该 输入 进行 处 理 。 假 设 我 们 希望 单独 测试 第 2 个 模 
块 的 正确 性 ， 而 你 已 知 第 1 个 模块 的 运算 结果 ， 即 键盘 输入 的 ASCII 码 是 存放 在 R0 中 的 ， 那 么 你 可 
以 直接 在 RO 中 放 入 一 个 ASCII 码 ， 然 后 控制 调试 器 直接 从 第 2 个 模块 开始 执行 (而 不 必 从 第 1 个 模块 
开始 执行 )。 

2. 控制 指令 序列 的 执行 

所 谓 控 制 指令 序列 的 执行 包括 : (1) 可 以 从 任意 起 点 执行 特定 的 指令 序列 (而 不 一 定 非 要 从 
程序 入 口 处 开始 ， 或 是 执行 全 部 程序 ) ，(2) 暂停 程序 的 执行 (以 查看 至 此 为 止 内 存 或 寄存 器 中 的 
程序 运算 结果 )。 为 此 ， 执 行 序列 操作 的 三 个 基本 操作 是 ， 直接 运行 (run)、 单 步 或 多 步 跳 步 执行 
(step)、 设 置 断 点 (set breakpoint)。 

运行 命令 就 是 启动 程序 的 执行 ， 直 到 必须 停止 为 止 ， 如 遇 到 HALT 指 令 或 断 点 。 

跳 步 命令 可 以 使 得 程序 执行 特定 数目 的 指令 之 后 就 停止 。 用 户 可 以 通过 交互 方式 输入 跳 步 命 
令 及 命令 参数 (如 本 次 执行 指令 的 数目 )。 如 果 数 目 为 !， 则 执行 一 条 指令 后 就 停止 。 我 们 称 这 种 
只 执行 一 条 指令 的 方式 为 “ 单 步 执 行 ”(single-stepping)。 这 种 方式 使 得 我 们 可 以 在 执行 一 条 指令 
后 就 查看 该 指令 的 执行 结果 。 

设置 断 点 命令 可 以 强制 程序 执行 到 特定 指令 处 停止 。 断 点 设置 的 实现 机 制 是 ; 将 指定 的 断 点 地 
址 添加 到 模拟 器 维护 的 一 张 “ 断 点 列表 ”中 ， 随后， 在 每 条 指令 的 FETCH 节 拍 ， 都 将 当前 PC 内 容 
与 该 列 表 相 匹配 ， 如 果 发 现 匹 配 则 中 止 执 行 。 设 置 断 点 的 效果 就 是 让 程序 连续 执行 (而 不 需要 跳 步 
执行 )， 直 到 PC 值 与 列表 中 任意 一 个 断 点 地 址 相同 为 止 。 它 的 用 处 是 使 得 我 们 知道 革 段 代码 是 否 被 
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执行 了 。 具 体 使 用 方法 是 先 执行 “ 断 点 设置 ”命令 ， 然 后 执行 “运行 ”命令 。 程 序 将 完全 自主 地 运 
行 ， 直 到 断 点 处 。 用 户 可 以 查看 此 时 的 程序 运行 状态 (如 内 存 或 寄存 器 的 内 容 )。 之 后 ， 如 果 我 们 
希望 程序 下 次 不 再 在 此 断 点 处 停止 ， 可 以 通过 “清除 断 点 ”(Clear Breakpoint) 命令 将 其 撤消 。 

3. 内 容 查 看 

当 模 拟 器 停止 的 时 候 ， 可 以 使 用 “查看 ”命令 检查 任意 内 存单 元 或 寄存 器 的 内 容 。 


6.2.2 交互 式 调试 器 的 使 用 


下 面 将 通过 4 个 例子 ,演示 通过 调试 器 发 现 程序 错误 的 操作 方法 。 我 们 设计 了 4 种 错误 : 

(1) 不 正确 的 循环 控制 ， 使 得 循环 体 出 现 了 不 正确 的 执行 次 数 (或 遍 数 ) 。 

(2) 不 正确 的 load 命 令 使 用 ， 原 先是 希望 通过 load 指 令 (0010) 将 内 存单 元 的 内 容 装 和 人 寄存 器 ， 
但 由 于 错误 地 使 用 了 “load effective address” 指 令 (1110) ， 使 得 内 存 的 地 址 (而 不 是 内 容 ) 被 装 
入 了 寄存 器 。 

(3) 忽略 了 设置 条 件 代码 指令 的 存在 ， 导 致 条 件 跳 转 指令 的 条 件 判 断 失 误 。 

(4) 忽略 了 输入 值 的 所 有 可 能 性 。 





我 们 可 能 已 发 现 ， 如 果 采 用 断 点 方式 ， 能 节省 很 多 调试 工作 。 即 只 要 在 x3203 处 设置 断 点， 就 
可 以 让 我 们 检查 每 次 循环 执行 的 结果 ， 而 不 需要 逐条 地 跟踪 每 条 指令 的 执行 。 图 6-4c 显 示 的 就 是 这 
种 方法 的 跟踪 结果 ， 其 中 的 每 行 对 应 一 次 循环 。 我 们 发 现 循环 次 数 是 4 次 而 不 是 3 次 (本 来 应 该 的 
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循环 次 数 ) 。 
Address — 15 14 13 12 11 10 9 8 7 6 
x3200 
x3201 
x3202 
x3203 
x3204 


R2«-0 









x3203 | 10 | 10 
x3203 | 20 | 10 
x3203 | 30 | 10 
x3203 | 40 | 10 


b) 乘 法 程序 的 跟踪 i c) 断 点 方式 的 跟踪 
图 6-4 使 用 交互 式 调试 技术 发 现 例 1 中 的 错误 





最 后 对 这 个 例子 做 一 下 评述 。 在 开始 程序 跟踪 之 前 ， 先 将 R4 和 R5 初 始 化 为 10 和 3。 初 始 值 的 
选择 对 程序 测试 相当 重要 ,. 你 必须 保持 头脑 清醒 。 在 此 ， 程 序 声明 了 只 对 两 个 正 整数 操作 有 效 ， 
所 以 10 和 3 是 OK 的 。 如 果 这 个 乘法 程序 说 的 是 对 所 有 的 整数 都 有 效 ， 那 么 还 需要 多 加 几 种 如 下 的 
测试 场景 (WE): -6 和 3、4 和 -12、-5 和 -7。 但 还 是 漏 了 一 个 最 重要 的 初始 值 一 -全 0 ( 即 0 和 
0)， 因 为 “所 有 ”的 整数 包括 了 正 整 数 、 负 整数 还 有 0。 这 里 要 指出 的 是 ， 一 个 正确 的 程序 应 该 是 
在 所 有 的 情况 下 都 保证 能 正确 运行 的 程序 ， 好 的 测试 技术 之 一 ， 就 表现 在 能 对 变量 做 非常 正规 的 
初始 化 〔 即 那些 容易 被 大 多 数 程序 员 所 忽略 的 )， 这 些 初始 值 被 俗称 为 “死角 ”。 
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R1«-0 

R4«-0 
R4<-R4 + 10 
R2«-M[x3100] 
R3«—M[R2] 
R2«-R241 
R1«-Rl + R3 
R4«-R4-1 
BRp x3004 





b) 相 加 程序 的 前 4 条 指令 执行 结果 
图 6-5 使 用 交互 式 调试 发 现 例 2 中 的 错误 


Contents Contents 
x3107 x0000 
X2819 x0000 
x0110 x0000 
x0310 . x0000 
x0110 x0000 
x1110 x0000 
x11B1 x0000 


x0019 x0000 
x0007 x0000 
x0004 x0000 





图 6-6 例 2 中 内 存 x3100~x3113 的 内 容 


初 看 这 个 程序 应 该 是 没 问 题 的 。 但 是 ， 我 们 执行 这 个 程序 并 检查 R1 的 内 容 (x3100~x3109 的 求 
和 ) ， 竟 然 是 x0024 (而 不 是 x8135)。 哪 里 出 错 了 呢 ? 

使 用 调试 器 看 看 。 图 6-5b 是 前 4 条 指令 (初始 化 操作 ) 执行 的 情况 。 注 意 ，x3003 指 令 执行 之 
后 ，R2 的 内 容 是 x3107 (而 不 是 x3100)。 问 题 出 在 操作 码 0010， 装 入 寄存 器 R2 的 是 x3100 的 “内 容 ” 
而 不 是 x3100 的 “地 址 ”。 我 们 犯 的 错误 是 ， 应 该 使 用 操作 码 1110 将 x3100 的 地 址 (而 不 是 内 容 ) 装 
入 R2。 修 改 操 作为 : 将 操作 码 0010 替 换 成 1110， 之 后 运行 成 功 。 
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Address 15 14 13 12 11 1009 8 7 6 5 4 3 2 

x0 fo 1 0 1] iilo o o RO<-0 
x301 Jo 0 0 i) ES 0 0 ROc-RO + 1 
x3002 |o 1 0 || 0 RI«-0 
ow [5 9 11] 二 
x3004 |o 1 0 !| o 1 1]|1|0 0 0 o 0 |Rx-o 
d m nos 10 9 x 0-15 Diu 3-8 3-9 0e 
306 |o o 1 oļı o ojo 00 0 o 1 R4<-M[x3010] 
x07 jo 1 1 ojo 1 o[r o ofo o o o 0 0|R2<-MIR4l 
se [pa 3 1|5.i x]. 3 [IS 9 [9-3 3- recen 
x09 |o o o olo 1 ofo 0o 0 0 0 0 1 O0 1 |BRzx30F 
PRTECEERESINCNCIECNCRERERCRCRCAER E 
EM CRUEDEES a DEC NE D 
deu x scaracw[a 6 x 2-9 ensi 
eh SCR [s 
um rios ris users itbeaca 9 es 
x300F |1 1 1 110 o 0 0lo0 1 00 1 0 1 |HAT 
300 [0 0 1 1 0 0 0 x3100 





b) 设置 断 点 x300D 跟 踪 例 3 程序 的 执行 


图 6-7 使 用 交互 式 调 试 发 现 例 3 中 的 错误 


我 们 开始 运行 这 段 程序 ， 事 先 准 备 好 样本 数据 且 在 地 址 x3108 处 特意 放置 了 一 个 5。 但 程序 结 


束 的 时 候 ， 我 们 发 现 R0=0， 即 意味 着 在 x3100~x310A 中 并 没有 5。 
出 什么 问题 了 ? 再 次 调试 运行 一 遍 ， 将 断 点 设置 在 x300D， 跟 踪 结 果 如 图 6-7b 所 示 。 
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”第 一 次 运行 至 断 点 时 ，PC=x300D， 且 x3100 的 内 容 已 被 测试 过 ，R2 也 装 入 了 数值 7 (x3101 的 
内 容 ) ，R3=9， 表 明 还 有 9 个 数据 未 被 测试 ，R4 的 内 容 对 应 于 刚 装 入 R2 的 数值 所 在 的 地 址 (BO 
x3101)。 

第 二 次 运行 至 断 点 时 ， 仍 然 是 PC=x300D，R2 装 人 了 数值 32 (x3102 的 内 容 )，R3 表 明 还 有 8 个 
数据 未 被 测试 。 

第 三 次 PC 又 变 成 x300D 的 时 候 ，R2 的 装 入 数值 是 0 (x3103 的 内 容 ) ，R3 指 示 还 有 7 个 数据 未 被 
测试 。 但 正 是 这 个 存放 在 x3103 的 数值 0， 导 致 x<300C 的 load 指 令 将 条 件 位 P 清 零 了 ， 进 一 步 造 成 
x300D 的 条 件 跳 转 没 有 发 生 ， 即 循环 “中 止 ” 了 1 随后 RO 被 置 0 (x300E)， 程 序 结 束 (x300F), 

错误 的 症结 在 于 ， 我 们 在 x300B 指 令 (计数 值 减 1) 和 x300D 指 令 ( 即 判断 计数 如 果 不 为 0 就 跳 
转 回 x3008 继 续 测 试 ) 之 间 揪 入 了 一 个 “故障 ”指令 (x300C 的 load 指 令 )。 由 于 load 指 令 会 改变 条 
件 码 ， 这 使 得 x300D 的 条 件 跳 转 指令 是 否 跳 转 完全 取决 于 R2 寄 存 器 ， 而 不 是 R3 寄 存 器 。 解 决 这 个 
问题 的 方法 是 ， 删 除 x300C 指 令 ， 并 修改 x300D 指 令 的 目的 地 址 为 x3007， 则 程序 运行 正常 。 

例 6-4 查找 字 中 的 第 一 个 1。 

最 后 的 这 个 例子 中 ， 隐 藏 的 是 最 难 发 现 的 bug 之 一 。 图 6-8 程 序 的 任务 是 检查 一 个 内 存单 元 的 
内 容 〈 即 某 个 地 址 中 存放 的 1 个 字 ) ， 逐 个 bit 地 检查 (从 左 至 右 ) 第 一 个 出 现 的 位 值 为 “1” 的 bit， 
并 将 该 bit 在 该 字 (word) 中 的 位 置 保存 在 R1 中 。 如 果 设 有 发 现 为 “1” 的 位 ( 即 全 部 位 为 0)， 则 
设置 R1 为 “~-1”。 例 如 ， 如 果 被 检查 单元 的 内 容 是 “0010000000000000”， 则 程序 结束 时 R1=13。 
如 单元 的 内 容 是 “0000000000000100”， 则 程序 结束 时 R1=2。 

程序 的 运行 过 程 如 下 : 

。 初 始 化 ( 像 所 有 的 程序 一 样 )。x3000 和 x3001 的 指令 负责 R1 的 初始 化 ， 方 法 与 前 面 的 例子 一 

FÉ. JEAND ( 清 0) 后 ADD， 完 成 对 R1 的 赋值 。 在 此 ，R1 被 初始 化 为 15。x3002 负 责 向 R2 
传人 x3100 内 存 的 内 容 (将 被 检查 的 数值 )， 这 里 采用 的 是 “间接 load” 指 令 ， 即 从 x3009 获 
得 存放 该 数值 的 地 址 x3100。 

。 第 1 次 测试 。x3003 测 试 的 是 该 数值 的 最 高 位 是 否 为 1 (等 价 于 判断 该 数 是 否 为 负数 )， 如 果 

是 1 则 跳 转 至 x3008 ( 即 程序 的 结束 点 )， 而 此 时 R1=15， 如 果 是 0 则 不 跳 转 ，R1 减 1 (x3004), 
指向 下 一 个 被 测试 的 位 bit[14]。 

。 左 移 和 第 2 次 测试 。x3005 让 R2 和 自己 相 加 ， 结 果 存 回 R2。 事 实 上 这 等 价 于 R2 乘 2， 又 等 价 

于 将 R2 的 内 容 左 移 1 位 ， 这 样 bit[14] 的 内 容 也 就 被 左 移 到 了 bit[15]， 使 得 条 件 跳 转 指 令 可 以 
通过 判断 该 数 是 否 为 负 ， 来 判断 该 位 的 内 容 。 然 后 ， 由 x3006 执 行 对 bit[14] (现在 是 bit[15] ) 
的 内 容 判 断 。 而 如 果 该 位 是 1， 则 跳 转 至 程序 结束 且 R1=14。 如 果 该 位 是 09， 则 继续 x3007 的 
执行 ，x3007 无 条 件 地 跳 转 至 x3004， 重 复 测 试 过 程 。 

。 下 一 次 测试 。 循 环 体 的 工作 就 是 每 次 完成 一 个 bit 的 测试 ， 即 R1 减 1 (x3004) ， 指 向 下 一 个 被 

测试 位 ，R2 内 容 左 移 ] 位 (x3005 ) ， 然 后 测试 新 的 bit[15] 内 容 (x3006)。 

以 上 过 程 重复 着 ， 直 到 发 现 了 第 1 个 “1”。 大 多 数 情 况 下 ， 该 程序 运行 正常 。 但 是 如 果 用 我 们 
提供 的 测试 数据 ， 它 就 出 问题 了 ， 永远 不 停止 ! 

图 6-8b 是 我 们 的 测试 跟踪 过 程 ， 断 点 设置 为 x3007。 跟 踪 记 录 显示 : 每 次 PC 都 是 x3007， 而 R1 
内 的 数值 每 次 递减 1。 其 中 的 原因 是 : R1 减 1，R2 内 容 左 移 ，bit 测 试 总 为 0， 所 以 程序 继续 而 不 终 
止 。 因 而 R1 的 内 容 不 断 地 变化 ，14、13、12、11、10、 9, 8, 7, 6. 5, 4, 3, 2, 1, 0, ~i, 
一 2、 一 3、 一 4， 如 此 反复 。 

出 现 问题 的 原因 是 ， 我 们 在 地 址 x3100 中 存放 的 是 x0000。 即 这 个 字 中 永远 不 会 出 现 “1”, 但 
对 于 这 个 程序 ， 至 少 要 存在 一 个 1 才 可 能 工作 正常 。 由 于 x3100 的 内 容 侈 部 为 0，x3006 的 跳 转 永 远 
不 会 发 生 ， 所 以 程序 总 是 在 永 不 停止 地 循环 着 (x3004、x3005、x3006、x3007、x3004、…)。 我 
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们 称 x3004 至 xz3007 的 这 段 序列 是 一 个 “ 环 ”(loop) ， 因 为 程序 无 法 打破 这 个 环 ， 所 以 我 们 又 称 它 


为 


“ERA” (infinite loop), 
这 是 最 难 检测 的 一 个 错误 〈 它 大 部 分 时 间 的 运行 都 是 正确 的 ) ， 但 同时 它们 也 是 最 重要 的 。 一 


个 程序 在 大 多 数 时 间 里 的 工作 都 是 正常 的 ， 这 是 不 够 的 ， 我们 必须 保证 它 时 时 刻 刻 工作 正常 ， 而 
不 管 我 们 交 给 它 的 数据 是 什么 。 在 本 书 的 后 面 内 容 中 ， 会 介绍 更 多 的 类 似 问题 。 


Address 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 








x3000 Ri«-0 
x3001 RI«-R1 +15 
x3002 R2«-MI[MIx3009]] 
x3003 BRn x3008 
x3004 RI«-R1-1 
x3005 R2«-R2 - R2 
x3006 BRn X3008 
x3007 BRnzp x3004 
x3008 HALT 
x3009 x3100 
b) 设 置 断 点 x3007 跟 踪 例 4 程序 的 执行 
图 6-8 使 用 交互 式 调试 发 现 例 4 中 的 错误 
6.3 习题 


6.1 


6.2 


6.3 


iR. 一 个 不 具备 “算法 ”特性 的 过 程 ， 能 否 采 用 结构 化 编程 的 三 个 基本 结构 来 构建 程序 ? 
如 果 可 以 ， 请 给 出 一 个 例子 (dion. 有关 “算法 ”的 定义 ， 参 考 第 1 章 )。 
LC-3 没 有 提供 减法 指令 。 如 果 要 对 两 个 数 做 减法 操作 ， 你 必须 写 一 个 函数 来 完成 它 。 给 出 两 
个 整数 减法 操作 的 系统 分 解 过 程 。 
回顾 前 几 章 的 “machine busy” 例 子 。 假 设 地 址 x4000 包 含 了 一 个 整数 (范围 为 0~15)， 指 示 
Wigs "TC" (busy) 状态 的 机 器 编号 。 再 假设 x4001 的 内 容 告 诉 我 们 哪些 机 器 正 处 于 忙 
(busy) 状态 ， 哪 些 机 器 正 处 于 空 闪 (idle) 状态 。 试 写 一 个 LC-3 的 机 器 语言 程序 ， 根 据 
x4000 的 内 容 ( 刚 处 于 busy 的 机 器 编号 ) 设置 x4001 的 对 应 位 。 

例如 ， 假 设 该 程序 执行 之 初 x4000 的 内 容 为 X0005，x4001 的 内 容 为 x3101， 则 程序 执行 之 
后 ，x4001 的 内 容 应 该 变 为 x3121 (提示 : LC-3 没 有 提供 OR 操作 ， 你 需要 使 用 AND 和 NOT 的 
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6.7 


6.8 


6.9 
6.10 
6.11 


6.12 


6.13 


# 117 


组 合 操作 实现 OR 操作 )。 

试 写 一 个 LC-3 程 序 ， 比 较 R1 和 R2 的 内 容 并 设置 RO0。 如 果 R1=R2， 则 RO=0， 如 果 R1>R2， 则 
RO=1， 如 果 R1<R2， 则 RO0= 一 1。 

下 面 的 两 个 乘法 算法 哪 一 个 更 好 ， 为 什么 ? 88 x 3=88+88+88 或 3+3+3+…+3。 

基于 习题 6.3 和 6.4 的 答案 ， 写 一 个 高 效率 的 两 个 整数 的 乘法 程序 ， 并 将 结果 保存 在 R3。 给 出 
该 问题 的 系统 分 解 过 程 ， 从 问题 描述 到 最 后 的 程序 (提示 : 所 谓 的 “高 效率 ”， 参 考 习 题 6.5 
的 讨论 ) 。 

阅读 以 下 LC-3 代 码 ， 请 问 该 程序 的 任务 是 什么 ? 


x3001 1110 0000 0000 1100 
X3002 1110 0010 0001 0000 
x3003 0101 0100 1010 0000 
x3004 0010 0100 0001 0011 
x3005 0110 0110 0000 0000 
x3006 0110 1000 0100 0000 
x3007 0001 0110 1100 0100 
x3008 0111 0110 0000 0000 
x3009 0001 0000 0010 0001 
x300A 0001 0010 0110 0001 
x300B 0001 0100 1011 1111 
x300C 0000 0011 1111 1000 
x300D 1111 0000 0010 0101 
x300E 0000 0000 0000 0101 
x300F 0000 0000 0000 0100 
x3010 0000 0000 0000 0011 
x3011 0000 0000 0000 0110 
x3012 0000 0000 0000 0010 
x3013 0000 0000 0000 0100 
x3014 0000 0000 0000 0111 
x3015 0000 0000 0000 0110 
x3016 0000 0000 0000 1000 
x3017 0000 0000 0000 0111 
x3018 0000 0000 0000 0101 


6.1.4 节 的 字符 数 统计 程序 中 ， 为 什么 一 定 要 初始 化 R2? 换 句 话说 ， 如 果 我 们 将 R2 一 0 的 这 行 
代码 删除 ， 读 程序 可 能 会 出 什么 问题 ? 
采用 循环 结构 ， 写 一 个 LC-3 程 序 ， 在 屏幕 上 显示 100 个 Z 字 符 。 

采用 条 件 结构 ， 写 一 个 LC-3 程 序 ， 判 断 存放 在 R2 中 的 数值 是 否 是 “奇数 ”(odd) 。 

写 一 个 LC-3 程 序 ， 将 地 址 A 到 地 址 B 之 间 的 所 有 内 存单 元 的 内 容 加 1。 假 设 这 些 内 存单 元 的 内 

容 已 被 初始 化 为 有 意义 的 数值 ， 而 地 址 A 和 B 的 具体 地 址 值 分 别 从 x3100 和 x3101 内 存单 元 获 

得 (提示 : 数据 的 访问 为 间接 寻 址 方式 )。 

a. 写 一 个 echo 程 序 ， 即 将 键盘 输入 的 字符 回 显 在 屏幕 上 。 假 如 刚才 的 键盘 输入 为 字符 R， 则 
程序 马上 将 字符 R 输 出 在 屏幕 上 。 

b. 将 a 的 问题 扩展 一 下 ， 每 次 回 显 一 行 〈 而 不 是 一 个 字符 ) 。 例 如 ， 用 户 输 入 “The quick 
brown fox jumps over the lazy dog.”， 则 程序 一 直 等 待 ( 无 显示 输出 )， 直 到 用 户 输 入 回 车 
键 (Enter 键 ，ASCII 码 为 x0A)， 才 将 进行 一 次 性 输出 。 

已 知 通 过 数值 的 自身 相 加 操作 可 以 实现 对 该 数 的 左 移 1 位 操作 。 例 如 ， 二 进 制 数 0011 自 己 加 

自己 ,结果 为 0110 ( 即 等 价 于 左 移 1 位 )。 但 是 右 移 1 位 的 操作 却 不 是 简单 的 事情 。 设 计 一 个 
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LC-3 程 序 ， 将 x3100 的 内 容 右 移 1 位 。 
6.14 ”阅读 下 面 的 机 器 语言 程序 : 


x3000 0101 0100 1010 0000 
x3001 0001 0010 0111 1111 
x3002 0001 0010 0111 1111 
x3003 0001 0010 0111 1111 
x3004 0000 1000 0000 0010 
x3005 0001 0100 1010 0001 
x3006 0000 1111 1111 1010 
x3007 1111 0000 0010 0101 


问 : R1I 的 初始 值 为 多 少 的 时 候 ， 才 能 使 R2 的 最 终 值 为 3? 

615 下 表 显示 的 是 x3010 程 序 执行 之 前 (before) 和 执行 之 后 (after) 的 内 存 和 寄存 器 内 容 变化 。 
你 的 任务 是 : 判断 存放 在 x3010 的 指令 是 什么 指令 注意， 以 下 的 信息 足以 判断 出 该 指 令 是 
什么 ， 所 以 “细心 + 耐心 ) ? 





Before (之 前 ) After (之 后 ) 
RO: x3208 x3208 
RI: x2d7c x2d7c 
R2: xe373 xe373 
R3: x2053 x2053 
R4: x33ff x33ff 
R5: x3f1f x3f1f 
R6: xf4a2 xf4a2 
R7: x5220 x5220 
x3400: x3001 x3001 
x3401: x7a00 x7a00 
x3402: x7a2b x7a2b 
x3403: xa700 xa700 
x3404: xf011 xf011 
x3405: x2003 x2003 
x3406: x3lba xe373 
x3407: xc100 xc100 
x3408: xefef xefef 


6.16 ”地址 x3000~x3006 之 间 存 放 了 一 段 LC-3 程 序 。 程 序 从 x3000 开 始 执行 。 我 们 在 执行 过 程 中 跟 
踪 记 录 MAR 的 所 有 变化 值 ， 获 得 以 下 序列 值 ， 我 们 称 这 个 序列 值 为 “跟踪 记录 ”。 
MAR Trace 
x3000 
x3005 
x3001 
x3002 
x3006 
x4001 
x3003 
x0021 


下 表 显 示 的 是 内 存 x3000~x3006 的 内 容 。 你 的 任务 是 填充 表 中 的 空格 (0 或 1)， 结 合 上 面 
的 MAR 跟 踪 记 录 信 息 。 



















GO[e[eleje[ [T|] 
EEEE REEE 
prirpepe[o] | | | 

[| | LI LII TT 
[9 rjr[ipr]e[ojojo[oe]o]r]o]o]:]og]rg 
xos Jojoe[o[e[e[|e|e]o]o[e[r | r[jo]o]oj|o 
[ow | | | | | | 01 1 LLL LL Ld. 


617 下 表 显 示 的 是 位 于 x3210 的 LC-3 指 令 在 执行 之 前 和 执行 之 后 的 内 存 和 寄存 器 内 容 变化 。 你 的 
任务 是 : 判断 存放 在 x3210 的 指令 是 什么 指令 (注意 ， 以 下 的 信息 足以 判断 出 该 指令 是 什么 ， 
所 以 “细心 + 耐心 ) ? 









Before (之 前 ) After (之 后 ) 

RO: xFFID xFFID 
RI: x301C x301C 
R2: x2F11 x2F11 
R3: x5321 x5321 
R4: x331F x331F 
R5: x1F22 x1F22 
R6: xO1FF xOIFF 
R7: x341F x3211 
PC: X3210 X3220 
N: 0 0 

Z: 1 1 

P: 0 0 





618 LC-3 没 有 提供 除法 指令 。 程 序 员 必须 写 一 个 函数 才能 实现 除法 操作 。 给 出 求解 两 个 “ 正 整 
数 ” 除 法 问题 的 系统 分 解 。 要 求 : LC-3 程 序 从 x3000 开 始 执行 ， 被 除数 位 于 x4000， 除 数位 
于 x4001， 商 存放 在 x5000， 余 数 存 放 在 x5001。 

6.19 有 时 我 们 希望 将 一 个 消息 (message) ME (如 不 希望 好 奇 者 偷 看 )。 消 息 是 由 一 串 ASCH 字 
符 组 成 的 ， 每 个 ASCII 字 符 占据 一 个 内 存单 元 ( 且 bit[15:8] 都 为 0) ， 存 帮 是 连续 的 〈 即 相 邻 
的 消息 字符 之 间 不 会 有 间隔 ， 也 不 会 倒序 ) ， 且 该 字符 串 的 结束 必定 是 x0000。 

一 个 没有 上 过 这 门 课 的 学 生 写 下 这 样 一 个 程序 : 从 x4000 开 始 ， 将 每 个 字符 都 加 4， 然 

后 存放 在 x5000 开 始 的 内 存 中 。 例 如 ， 假 设 x4000 开 始 的 内 容 是 “Matt”， 则 加 密 后 存放 在 
x5000 的 内 容 应 该 是 “Qeyy”。 但 是 ， 他 /她 的 代码 中 存在 4 个 bug。 找 出 它们 并 予以 纠正 。 


x3000 1110 0000 0000 1010 
x3001 0010 0010 0000 1010 
x3002 0110 0100 0000 0000 
x3003 0000 0100 0000 0101 
x3004 0001 0100 1010 0101 
x3005 0111 0100 0100 0000 
x3006 0001 0000 0010 0001 
x3007 >- 0001 0010 0110 0001 
x3008 。 0000 1001 111i 1001 
x3009 0110 0100 0100 0000 
x300A 1111 0000 0010 0101 
x300B 0100 0000 0000 0000. 
x300C 0101 0000 0000 0000 


620 重 做 习题 6.18 ， 将 范围 扩展 为 “所 有 整数 ” ， 而 不 仅仅 是 “ 正 整 数 "。 


第 7 章 汇编 语言 


可 能 你 早已 对 0 和 1 有 些 厌烦 了 ， 因 为 你 要 记 住 0001 代 表 ADD ，1001 代 表 NOT， 等 等 。 如 果 我 
们 能 提供 一 种 符号 名 方式 (而 不 是 16 位 的 数字 ) 来 代表 内 存 的 地 址 ， 你 或 许 不 会 反对 吧 ? 或 许 你 
希望 我 们 还 能 提供 一 种 更 简明 的 方式 来 描述 指令 (而 不 需要 记 住 其 各 个 bit 或 字段 的 定义 )。 好 的 ， 
我 们 马上 就 要 开始 介绍 这 样 一 种 语言 。 

本 章 我 们 将 介绍 汇编 语言 (assembly language) ， 我 们 可 以 将 它 理解 为 是 上 述 目标 的 各 种 实现 ， 
机 制 之 一 。 
7.1 汇编 语言 编程 一 一 更 .上 一 层 


回顾 我 们 在 第 1 章 的 图 1-6 中 提 到 的 层次 转换 问题 。 算 法 经 过 多 级 转换 ， 最 终 演 变 成 其 种 机 械 
语言 (mechanical language， 与 自然 语言 相 比 ， 显 得 很 机 械 )。 这 个 机 械 语言 可 以 类 似 我 们 在 第 5 章 
介绍 的 某 个 特定 计算 机 的 机 器 语言 。 换 句 话 说， 如 果 一 个 程序 中 的 每 条 指令 都 符合 且 对 应 某 个 计 
算 机 ISA 的 定义 ， 我 们 称 该 程序 是 用 “XXX 计算 机 的 机 器 语言 ”(machine language) 编写 的 。 

但 从 另 一 方面 来 说 ， 我 们 可 以 让 机 器 语言 变 得 友好 些 。 机 械 语言 也 可 以 分 为 高 级 的 (high- 
level) 和 低级 的 (low-level) 两 类 。 高 级 语言 如 C、C++、Java、Fortran、COBOL、Pascal 等 ， 约 
有 上 千 种 ， 它 们 的 指令 几乎 (但 不 完全 ) 都 模仿 了 自然 语言 的 语句 结构 (尤其 是 英语 ) 。 这 意味 着 ， 
一 旦 你 学 会 了 怎样 用 C 或 Pascal、Fortran 等 语言 为 一 种 机 器 结构 (ISA) 编写 程序 ， 那 么 ， 为 另 一 
种 ISA 编 写 程序 则 是 大 同 小 异 。 

高 级 语言 编写 的 程序 在 能 够 运行 之 前 ， 必 须 先 被 翻译 成 特定 ISA 机 器 语言 格式 的 代码 。 通 常 ， 
高 级 语言 的 一 条 语句 会 被 翻译 成 多 条 机 器 语言 指令 。 关 于 高 级 语言 ， 我 们 将 在 第 11 章 介绍 C 语 言 ， 
在 第 12~19 章 ， 介 绍 每 个 C 语 名和 它 对 应 的 LC-3 指 令 代 码 之 间 的 映射 关系 。 但 是 ， 本 章 只 计划 在 第 
5 章 的 基础 上 前 进 一 点 点 。 . 

这 个 进步 就 是 从 机 器 语言 升级 到 汇编 语言 。 汇 编 语言 属于 低级 语言 。 注 意 ， 不 要 试图 将 低级 
语言 的 一 个 指令 和 英语 中 的 一 个 句子 相对 应 。 相 反 ， 每 条 汇编 指令 通常 对 应 了 ISA 中 的 一 个 指令 。 
高 级 语言 通常 是 “ISA 无 关 的 ”， 而 低级 语言 则 是 “ISA 相 关 的 ”"。 事 实 上 ， 对 于 特定 的 ISA， 通 常 
只 存在 一 种 对 应 的 汇编 语言 。 

汇编 语言 的 目的 是 为 了 让 编程 过 程 更 加 友好 ( 相 比 第 5 章 介 绍 的 机 器 语言 )， 但 它 保 留 了 和 机 
器 语言 同样 的 细节 控制 能 力 。 所 不 同 的 是 ， 我 们 不 再 需要 记 住 类 似 “0001 是 什么 操作 码 ”"、“1001 
是 什么 操作 码 ”， 以 及 “内 存单 元 0011111100001010 存 放 了 什么 内 容 ” 这 样 枯燥 的 描述 。 在 汇编 语 
言 中 ， 我 们 采用 的 是 “ 助 记 符 ”(mnemonic) 方式 来 表示 ADD 和 NOT 之 类 的 操作 码 ， 而 内 存 地 址 
则 被 类 似 SUM、PRODUCT 之 类 的 “符号 名 ”(symbolic name) 所 替代 。 我 们 看 到 ，SUM 和 
PRODUCT 之 间 的 区 分 要 比 0011…010 和 0011…101 之 间 的 区 分 容易 ， 且 清晰 得 多 。 我 们 称 这 种 命名 
方式 为 “符号 地 址 ”(symbolic address) 。 

我 们 将 看 到 (从 第 11 章 开始 ) ， 高 级 语言 (如 C 语 言 ) 将 使 得 编程 工作 更 加 友好 ， 但 同时 也 将 
失去 对 计算 机 的 细节 控制 权 (因为 在 高 级 语言 中 ， 将 不 会 也 不 方便 提供 与 SA 相关 的 控制 指令 )。 


7.2 一 个 汇编 程序 
我 们 将 通过 一 个 程序 例子 开始 LC-3 汇 编程 序 的 讲解 。 图 7-1 程 序 的 目的 是 将 最 初 存放 在 


DE E A 121 





NUMBER 的 整数 乘 以 56， 实现 方法 是 将 NUMBER 这 个 数 反复 地 加 6 次 。 假 设 ， 存 放 在 NUMBER 的 


整数 是 123， 则 该 数 乘 以 6 的 乘积 等 于 123+123+123+123+123+123。 
该 程序 包含 21 行 ， 我 们 在 每 行 代码 的 开始 添加 了 行 号 〈 源 程序 中 是 没有 行 号 的 ， 在 此 只 是 为 


; Program to multiply an integer by the constant 6. 
; Before execution, an integer must be stored in NUMBER. 


x3050 
R1,SIX 
R2,NUMBER 
R3,R3,40 ; Clear R3. It will 
; contain the product. 


; The inner loop 


AGAIN R3,R3,R2 
R1,R1,#-1 ; R1 keeps track of 
AGAIN ; the iterations 


NUMBER . 1 
SIX . x0006 





图 7-1 一 个 汇编 程序 代码 


在 程序 中 ， 有 10 行 的 首 字符 是 “;”， 这 表明 这 些 行 是 只 供 人 (而 不 是 机 器 ) 阅读 的 ， 又 称 “ 注 - 
释 行 ”; 有 7 行 汇编 指令 (06、07、08、0C、0D、0E、10) 是 将 被 翻译 成 LC-3 机 器 指令 的 ， 即 真 
正 将 要 运行 的 ， 其 他 4 行 (05, 12, 13, 15) 是 伪 操 作 (pseudo-ops)， 是 程序 员 传 递 给 翻译 程序 
( 即 汇编 器 ) 的 信息 ， 用 于 提示 帮助 翻译 过 程 。 对 于 汇编 语言 ， 该 翻译 程序 被 称 做 “汇编 器 ” 
(assembler) ， 翻 译 过 程 则 被 称 做 “汇编 ”(assembly ) 。 


7.2.1 指令 

与 机 器 指令 (如 LC-3 ISA 的 16 位 0/1 序 列 ) 不 同 的 是 ， 汇 编 语言 指令 的 格式 包括 4 个 部 分 ， 如 
下 所 示 : 

LABEL OPCODE OPERANDS ; COMMENTS 

其 中 ，LABEL 和 COMMENTS 两 个 字段 是 可 选 的 。 

1. 操作 码 和 操作 数 

在 一 个 汇编 指令 的 所 有 字段 中 ， 操 作 码 (OPCODE) 和 操作 数 (OPERAND) 两 部 分 是 必需 的 
(mandatory) 。 一 个 指令 必须 有 操作 码 (做 什么 事情 ) 及 操作 数 (被 操作 的 对 象 )。 这 一 点 应 该 不 
会 奇怪 的 ， 第 5 章 的 LC-3 ISA 机 器 指令 也 是 如 此 。 

其 实 ，OPCOPDE 就 是 对 应 LC-3 指 令 的 一 个 符号 名 〈 是 字符 串 表 示 的 ， 而 不 是 0/1 串 表示 的 ) 。 
这 样 做 的 目的 是 方便 记忆 ， 如 ADD、AND、LDR 总 比 0001、0101、0110 更 容易 记忆 。 图 5-3 (以 及 
图 A-2) 列举 了 LC-3 指 令 的 15 个 OPCODE，。 

操作 数 的 数目 取决 于 具体 的 操作 。 例 如 ADD 指 令 〈 第 0C 行 ) 需要 3 个 操作 数 【( 两 个 相 加 的 源 
操作 数 ，1 个 存放 结果 的 目的 操作 数 )。 所 有 这 3 个 操作 数 都 必须 显 式 地 在 指令 中 标识 出 来 :; 

AGAIN ADD R3,R3,R2 

寄存 器 R2 和 R3 是 被 相 加 的 源 操作 数 ， 结 果 被 存放 在 R3 寄 存 器 中 。 我 们 用 RO0、R1、…R7 代 表 8 
个 寄存 器 。 i 
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LD 指令 (850747) 需要 两 个 操作 数 (被 读 人 数据 所 在 的 内 存 地址 和 存放 该 数据 的 寄存 器 ) 。 在 后 面 
的 例子 中 ， 我 们 将 直接 使 用 标号 来 表示 内 存 地 址 。 例 如 ， 本 例 中 的 NUMBER 就 是 代表 内 存 地 址 的 标号 。 

LD R2, NUMBER 

我 们 在 5.1.6 节 中 介绍 过 ， 操 作 数 的 获取 可 以 来 自 寄存 器 、 内 存 或 直接 来 自 指令 (立即 数 )。 在 
寄存 器 操作 数 方式 下 ， 寄 存 器 的 表示 是 显 式 的 (如 第 0C 行 中 的 R2 和 R3) ， 在 内 存 操作 数 方式 下 ， 
内 存 地 址 被 显 式 地 表示 为 符号 名 (如 07 行 的 NUMBER 和 06 行 的 SIX) ， 在 立即 数 操作 数 方式 下 ， 
其 数值 被 显 式 地 表示 出 来 〈 如 08 行 的 数值 0) 。 

AND R3, R3, #0 ; Clear R3. It will contain the product. 

立即 数 的 标识 符 代 表 了 该 数值 的 基 ， 即 标识 符 “#” 代 表 十 进 制 ( 即 base=10),“x” 代 表 十 六 
进 制 ,“b” 代 表 二 进 制 。 有 时 候 ， 即 使 没有 标识 符 也 不 会 出 现 二 义 性 ， 如 3F0A ( 它 一 定 是 个 十 六 
进 制 数 ) ， 尽 管 如 此 ， 我 们 还 是 把 它 写 成 x3FOA， 有 的 时 候 则 会 出 现 二 义 性 ， 如 1000、x1000 等 价 
于 十 进 制 数 4096， 而 b1000 则 代表 十 进 制 数 8，#1000 则 代表 十 进 制 数 1000。 

2, 标号 

标号 (label) 是 指向 内 存单 元 的 一 个 符号 名 ， 它 可 以 在 程序 中 直接 引用 。LC-3 汇 编 语言 中 ， 
一 个 标号 可 以 包含 1~20 个 字符 〈 如 大 写 或 小 写 的 字母 或 数字 ) ， 但 首 字符 必须 是 字母 。NOW、 
Under21、R2D2、C3PO 等 都 是 合法 的 标号 例子 。 

显 式 访问 内 存单 元 的 情况 有 两 种 : 

(1) 该 单元 的 内 容 是 指令 ， 该 单元 地 址 是 跳 转 指令 的 目标 (如 0C 行 的 AGAIN)。 

(2) 该 单元 的 内 容 是 load 或 store 指 令 访问 的 数值 (如 12 行 的 NUMBER 和 13 行 的 SIX) 。 

标识 AGAIN 被 跳 转 指令 访问 的 例子 ， 如 0E 行 所 示 : 

BRP AGAIN 

如 果 之 前 的 ADD R1,R1,#- 1 的 运算 结果 是 正 数 ( 即 P 位 被 置 1) ， 则 跳 转 指令 跳 转 到 由 AGAIN 
显 式 指向 的 位 置 ， 即 下 一 轮 循环 的 开始 。 

标识 NUMBER 被 load 指 令 引 用 的 例子 如 07 行 所 示 ， 即 存放 在 NUMBER 指 向 地 址 包含 的 数值 被 
HARET Eo 

如 果 一 个 内 存单 元 从 来 不 会 被 程序 引用 ， 则 没有 必要 为 其 做 标号 。. 

3. 注释 

注释 (comment) 是 那些 仅 供 人 阅读 的 信息 。 换 句 话 说， 这 些 信 息 不 会 影响 程序 的 翻译 过 程 
(事实 上 LC-3 沪 编 器 根本 就 不 处 理 这 些 信息 )。 在 程序 中 它们 被 分 号 GO) 隔 开 。 在 一 行 指令 中 ， 分 
号 意味 着 本 行 中 分 号 之 后 的 内 容 都 是 注释 ， 这 些 内 容 都 将 被 汇编 器 忽略 。 如 果 程 序 中 一 行 的 第 一 
个 非 空 字符 是 分 号 ， 则 整 行 被 忽略 ， 如 果 分 号 是 跟 在 一 条 指令 之 后 ， 则 分 号 之 后 的 内 容 被 忽略 。 

注释 的 目的 是 方便 程序 的 阅读 。 它 用 来 对 一 条 或 一 组 上 临 涩 的 指令 代码 做 注解 。 如 08 和 09 行 的 
注释 “Clear R3; it will contain the product” 告 诉 读者 的 是 ， 第 8 行 的 指令 是 为 乘法 运算 做 初始 化 操 
作 ， 即 将 R3 清 零 。 因 为 ， 对 一 个 程序 员 来 说 ， 他 /她 很 清楚 “AND R3,R3,#0” 这 条 指令 的 作用 是 什 
4, 但 是 两 年 后 ， 在 他 又 完成 了 30000 行 代码 之 后 ， 他 /她 必然 完全 忘记 了 这 条 指令 的 当初 目的 ( 当 
然 通 过 上 下 文 代码 阅读 ， 还 是 会 推理 出 这 条 指令 的 作用 的 )。 还 有 可 能 的 情况 是 ， 两 年 后 这 个 程序 
员 已 经 离开 公司 了 ， 而 公司 此 时 要 修改 /升级 该 程序 。 如 果 任 务 分 给 了 一 个 从 来 没有 读 过 这 个 代码 
的 人 ， 那 么 注释 将 有 助 于 对 程序 的 理解 。 

值得 一 提 的 是 ,，“ 不 要 滥用 注释 ”。 注 释 提 供 的 应 该 是 更 深 的 “洞察 力 ”"， 而 不 是 对 显而易见 事 
实 的 重 述 。 这 样 做 的 原因 有 两 个 : 一 是 重 述 浪费 时 间 ， 二 是 过 多 不 重要 的 注释 将 掩盖 那些 “重要 ” 
的 注释 信息 ， 让 程序 变 得 杂乱 无 章 。 例 如 ， 第 0D 行 的 注释 “Decrement R1” 就 属于 废话 ， 它 没有 
提供 任何 比 指令 本 身 更 多 、 更 有 用 的 信息 ， 反 而 把 程序 版 面 搞 得 更 杂乱 。 
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注释 的 另 一 个 目的 ， 同 时 也 是 一 行 中 额外 的 空格 的 目的 ， 就 是 使 程序 更 加 直观 ， 易 于 理解 。 
因而 ， 这 些 注 释 的 作用 是 将 程序 的 各 个 代码 片段 分 隔 开 来 ， 提 高 程序 的 可 读 性 。 即 将 相关 的 指令 
或 代码 〈 即 一 起 工作 并 产生 一 个 结果 的 ) 连续 排放 ， 例 如 注释 行 0B 和 0F 的 作用 ， 就 是 将 0C~0E 的 
代码 段 与 程序 其 他 部 分 区 分 开 来 ， 而 0B 和 0E 行 中 ， 除 了 一 个 分 号 别 无 其 他 。 

这 些 额 外 的 空格 除了 起 到 程序 中 各 元 素 的 对 齐 作 用 之 外 (如 指令 、 注 释 的 列 对 齐 ， 各 代码 片 
段 间隔 的 行 对 齐 )， 汇 编 器 并 不 对 它们 做 任何 处 理 。 


7.2.2 Ht 


LC-3 汇 编 器 本 身 也 是 一 个 程序 ， 只 不 过 它 是 这 样 一 个 程序 : 输入 是 以 行 或 字符 串 为 单位 的 程 
FF (用 LC-3 汇 编 语言 编写 的 ) ， 而 其 输出 是 对 LC-3 汇 编程 序 的 翻译 结果 ( 即 LC-3 ISA 机 器 代码 )。 
其 中 ，LC-3 汇 编程 序 中 的 伪 操 作 (pseudo-ops) 用 来 对 该 翻译 过 程 起 到 辅助 作用 。 

事实 上 ， 伪 操作 的 一 个 更 标准 的 名 字 是 “汇编 指令 ”(assembler directive)。 它 们 之 所 以 被 称 
为 伪 操 作 ， 原 因 是 ， 它们 不 代表 (被 翻译 的 汇编 ) 程序 中 的 任何 操作 ， 或 者 说 程序 执行 时 它们 是 
不 产生 任何 操作 的 。 伪 操作 可 以 理解 为 是 程序 员 传 递 给 汇编 器 的 消息 ， 用 于 指导 汇编 器 的 汇编 操 
作 。 当 汇编 器 看 到 这 些 消 息 后 ， 就 将 这 些 伪 操作 丢弃 。LC-3 汇 编 器 具有 5 种 伪 操 作 : .ORIG.、 
FILL.、BLKW、.STRINGZ、.END。 开 头 的 点 号 “.” 代 表 这 是 一 个 伪 操 作 。 

1. ORIG 

.ORIG 告 诉 汇 编 器 将 LC-3 程 序 放 在 内 存 的 什么 位 置 。 如 第 05 行 的 “.ORIG x3050” 是 说 “从 
x3050 开 始 "， 于 是 LD R1,SIX 指 令 就 被 放 在 地 址 x3050 处 。 

2. FILL 

.FILL 告 诉 汇编 器 开始 (占用 ) 下 一 个 地 址 ， 并 填充 初始 值 (如 其 操作 数 ) 。 如 第 13 行 ， 也 即 
最 终 LC-3 程 序 的 第 9 个 单元 ， 该 单元 被 初始 化 为 数值 x0006。 

3. BLKW 

.BLKW 告 诉 汇 编 器 在 程序 空间 中 ， 开 始 占用 一 连 串 的 地 址 空间 (Hil "a BLocK of Word"), A 
体 的 占用 数目 由 .BLKW 伪 操作 的 操作 数 决定 ， 如 第 12 行 指示 汇编 器 占用 1 个 内 存 空间 (很 巧 的 是 ， 
该 空间 还 被 标识 为 NUMBER ) 。 

.BLKW 特 别 适 用 于 操作 数值 不 确定 的 场合 。 例 如, 内 存 中 的 某 个 单元 是 用 来 存放 键盘 输入 值 的 ， 
而 键盘 输入 直到 程序 运行 时 才能 知道 ， 那 么 它 所 占用 的 空间 就 可 以 事先 通过 .BLKW 来 申请 占用 。 

4. STRINGZ 

.STRINGZ 告 诉 汇 编 器 连续 占用 并 初始 化 x+1 个 内 存单 元 ， 其 参数 (或 操作 数 ) 是 双 括 号 括 起 
来 的 个 字符 。n+1 个 内 存单 元 的 前 个 字 的 内 容 分 别 是 字符 串 对 应 字符 的 ASCII 码 的 零 扩 展 (zero- 
extend) 值 ， 内 存 的 最 后 一 个 字 则 被 初始 化 为 0。 最 后 的 这 个 字符 x0000 通 常 为 ASCII 码 字符 串 的 处 


理 提供 了 哨兵 机 制 。 
例如 ， 如 下 代码 片段 : 
.ORIG x3010 


HELLO .STRINGZ "Hello, World!" 


将 导致 汇编 器 将 内 存 x3010~x301D 初 始 化 为 如 下 内 容 : 


x3010: x0048 
x3011: x0065 
x3012: x006C 
x3013: x006C 
x3014: x006F 
x3015: x002C 
x3016: x0020 
x3017: x0057 
x3018: x006F 


x3019: x0072 
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x301A: x006C 
x301B: x0064 
x301C: x0021 
x301D: x0000 


5. END 
.END 告 诉 汇 编 器 “程序 结束 了 ”*。 出 现在 .END 之 后 的 任何 字符 都 将 被 汇编 器 丢弃 。 


€; .END 并 不 会 停止 程序 的 执行 。 事 实 上 ， 最 后 的 程序 中 不 会 出 现任 何 .END 。 它 仅仅 是 一 个 分 隔 
TF (表示 源 程序 结束 了 ) 。 


7.2.3 例子 : 字符 数 统计 程序 


下 面 我 们 讲述 一 个 完整 的 例子 。 仍 然 以 5.5 节 的 问题 为 例 ， 即 写 一 个 程序 ， 从 键盘 读 和 人 一 个 字 
符 ， 并 统计 一 个 文件 中 该 字符 出 现 的 次 数 。 按 照 惯 例 ， 首 先 通 过 流程 图 描述 算法 。 在 6.1 节 中 ， 我 们 
学 习 了 怎样 先 将 一 个 问题 系统 地 分 解 成 多 个 模块 ， 然 后 生成 如 图 5-16 所 示 的 流程 图 。 事 实 上 ， 第 6 
章 的 最 后 一 步 生成 的 如 图 6-3e 的 流程 图 ， 本 质 上 和 图 5-16 是 一 样 的 ， 之 后 ， 就 是 按照 流程 图 写 程序 。 
但 这 次 写 程序 不 用 再 担心 0 和 和 1 了 ， 因 为 这 次 要 用 LC-3 汇 编 语言 完成 编程 任务 。 该 程序 如 图 7-2 所 示 。 






; Program to count occurrences of a character in a file. 
03 ; Character to be input from the keyboard. 

04 ; Result to be displayed on the monitor. 

; Program works only if no more than 9 occurrences are found. 









; Initialization 





.ORIG x3000 









0B AND R2,R2,80 ; R2 is counter, initialize to 0 
oc LD R3, PTR ; R3 is pointer to characters 

0D TRAP x23 ; RO gets character input 

0E LDR R1,R3,&40 ; Ri gets the next character 










Test character for end of file 


7 











TEST ADD R4,R1l,#-4 ; Test for EOT 
14 BRz OUTPUT ; If done, prepare the output 
15 i 

16 ; Test character for match. If a match, increment count. 











R1,R1 








19 ADD R1,R1,RO0 ; If match, Ri = xFFFF 
1A NOT R1,R1 ; If match, R1 = x0000 
1B BRnp GETCHAR i If no match, do not increment 





R2, R2 ,#1 










; Get next character from the file 





zo GETCHAR ADD R3,R3, #1 ; Increment the pointer 
21 LDR R1,R3,#0 ; R1 gets the next character to test 
22 BRnzp TEST 

23 ; 
24 ; Output the count. 





















OUTPUT LD RO,ASCII ; Load the ASCII template 











27 ADD RO,RO,R2 ; Convert binary to ASCII 
28 TRAP x21 ; ASCII code in RO is displayed 
29 TRAP x25 ; Halt machine 








2A i 
; Storage for pointer and ASCII template 

















ASCII .FILL x0030 
2E PTR .FILL x4000 
.END 





图 7-2 字符 统计 的 汇编 程序 
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在 此 ， 对 这 个 程序 做 些 说 明 

在 这 个 程序 中 ， 三 次 通过 系统 服务 调用 获得 操作 系统 服务 ， 即 TRAP 指 令 方式 。TRAP x23 是 
读 取 键盘 输入 并 将 其 存放 在 RO 寄存器 中 (第 0D 行 ) ; TRAP x21 是 将 RO0 中 存放 的 ASCII 显 示 在 屏幕 
上 (第 28 行 ) , TRAP x25 是 停机 操作 (第 29 行 )。 有 关 TRAP 指 令 的 工作 机 制 ， 仍 然 要 留 在 第 9 章 
中 展开 讨论 。 

有 半 ASCIH 码 。 数 字 0~9 (0000-1001) 的 对 应 ASCII 码 是 x30~x39， 所 以 它们 的 二 进 制 至 ASCII 
的 转换 方法 很 简单 ， 只 要 对 原 值 加 x30 即 可 。 第 2D 行 的 标识 “ASCIT” 指 定 的 内 存单 元 中 ， 存 放 的 
就 是 这 个 “x0030”。 

被 统计 文件 在 内 存 中 的 存放 位 置 是 x4000 (第 2E 行 )。 通 常 ， 这 个 起 始 地 址 是 不 为 写 这 个 程序 
的 程序 员 所 知 的 ， 因 为 我 们 希望 这 个 程序 能 处 理 不 同 的 文件 〈 即 存放 位 置 是 变化 的 ) 。 这 种 情况 的 
处 理 方法 将 在 7.4 节 讨论 。 


7.3 汇编 过 程 


7.3.1 概述 


一 个 LC-3 汇 编程 序 不 能 直接 执行 ， 它 必须 被 翻译 成 机 器 语言 代码 ， 才 能 被 机 器 识别 并 执行 。 
所 谓 机 器 语言 代码 或 程序 ， 即 其 中 的 每 条 指令 都 是 LC-3 ISA 格 式 的 (而 不 是 汇编 指令 格式 )。 这 个 
翻译 任务 是 由 汇编 器 完成 的 。 | 

假设 你 已 获取 了 现成 的 汇编 器 程序 ， 通 过 执行 特定 的 命令 ， 就 能 “指挥 ”该 汇编 器 完成 翻译 
工作 。 现 成 的 汇编 器 可 通过 Web 下 载 获 取 。 汇 编 器 的 运行 命令 是 assemble ， 参 数 之 一 是 汇编 程序 的 
文件 名 。 例 如 ， 如 果 文 件 名 是 solution1.asm ， 则 执行 命令 


assemble solutioni1.asm outfile 


生成 文件 outfile， 即 一 个 LC-3 ISA 格 式 的 机 器 语言 程序 文件 。 


7.3.2 两 遍 扫 描 

本 节 介 绍 汇 编 器 的 工作 原理 ， 即 从 汇编 语言 至 机 器 语言 的 翻译 过 程 。 我 们 以 图 7-2 的 汇编 程序 
作为 这 个 翻译 过 程 的 输入 。 

你 应 该 还 记得 ， 汇 编 语言 中 的 指令 和 翻译 后 的 机 器 语言 指令 之 间 是 存在 “一 一 对 应 ”关系 的 。 
直观 上 ， 这 意味 着 从 头 到 尾 只 需要 一 遍 就 可 以 完成 翻译 。 下 面 以 图 7-2 的 程序 为 例 ， 汇 编 器 可 以 直 
接 将 第 01~09 行 丢弃 ， 因 为 它们 只 是 注释 (而 不 是 指令 )， 是 供 人 阅读 的 (而 不 是 执行 的 ) ， 对 翻译 
过 程 来 说 毫 无 作用 。 于 是 ， 汇 编 器 移 至 第 0A 行 。0A 行 是 一 个 伪 操 作 ， 它 告诉 汇编 器 “机 器 程序 将 
从 x3000 开 始 执行 ”; 再 移 至 0B 行 ， 这 是 个 AND 指 令 ， 很 容易 翻译 。 于 是 我 们 翻译 出 对 应 的 机 器 


指令 
x3000: 0101010010100000 


但 是 ， 当 LC-3 汇 编 器 开始 翻译 下 一 条 指令 (0C 行 ) 之 时 ， 问 题 出 现 了 ! 由 于 汇编 器 无 法 理解 
符号 PTR 的 意思 ， 汇 编 器 卡 过 了 ， 翻 译 过 程 中 止 。 

为 了 解决 这 个 问题 ， 汇 编 过 程 必须 对 整个 汇编 语言 程序 从 头 到 尾 (从 开始 到 .END) 多 走 一 亡 ， 
为 的 是 在 第 1 遍 过 程 中 先 确定 各 符号 名 (如 PTR) 所 对 应 的 二 进 制 地 址 ， 即 确定 所 有 符号 与 地 址 之 
间 的 映射 关系 。 我 们 称 这 个 映射 集合 为 “符号 表 ”。 

总 之 ， 两 遍 扫 描 的 任务 分 别 是 ， 第 1 遍 负责 符号 表 的 构建 ， 第 2 遍 负责 将 所 有 汇编 指令 翻译 成 
对 应 的 机 器 指令 。 
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LD R3,PTR 

那么 ， 汇编 器 在 第 2 遍 过 程 〔 即 翻译 过 程 )》 中 ， 再 次 遇 到 第 0C 行 (如 下 所 示 ) 时 

由 于 第 1 遍 已 确定 PTR 和 x3013 之 间 的 映射 关系 〈 即 建立 对 应 符号 表 项 ) ， 所 以 该 指令 被 成 功 翻 
译 为 

x3001: 0010011000010001 


换 名 话说， 之 前 “无 法 确定 PTR 地 址 ”的 问题 ， 通 过 两 编 扫描 机 制 予 以 解决 了 。 


7.8.89 %18. 创建 符号 表 


符号 表 并 不 复杂 ， 不 过 就 是 符号 名 和 16-bit 地 址 之 间 的 一 张 映射 表 。 表 项 的 生成 方法 是 在 第 1 
遍 扫 描 过 程 中 ， 为 每 条 指令 以 及 每 个 标识 顺序 分 配 地 址 ， 并 记录 标识 或 符号 及 其 所 对 应 的 地 址 。 
标识 所 对 应 的 地 址 通常 与 跳 转 指令 和 内 存 访 问 指令 (load 或 store) 相关 ， 即 要 么 是 跳 转 指令 的 目标 
地 址 ， 要 么 是 数据 存放 的 内 存 地 址 。 

换 名 话说， 只 要 编程 不 存在 错误 ， 所 有 的 标识 都 将 被 分 配 并 确定 对 应 地 址 ， 即 代码 中 通过 符 
号 或 标识 代表 的 内 存 引用 (指令 入 口 地 址 或 数据 单元 地 址 )， 最 终 都 将 顺利 替换 为 具体 的 地 址 。 

之 前 的 “ 伪 操 作 ” 介 绍 中 ， 我 们 知道 伪 操 作 指 令 .ORIG 和 .END 界 定 了 有 效 代 码 的 范围 ， 图 7-2 
的 汇编 程序 亦 如 此 。 但 在 7.4 节 中 ， 我 们 还 将 指出 包含 多 个 独立 代码 区 段 的 程序 方式 ， 即 一 个 程序 
由 多 个 代码 区 段 拼 装 而 成 ， 其 中 每 个 部 分 都 有 自己 的 .ORIG 和 .END， 并 分 别 被 独立 汇编 。 

第 1 遍 扫描 的 具体 操作 如 下 : 

(1) 首先 ， 直 接 丢 弃 01-09 行 的 注释 。 

(2) 之 后 ， 最 先 遇 到 的 应 该 是 一 个 .ORIG 伪 操作 (或 汇编 指令 ) ， 如 第 0A 行 所 示 。 它 意味 着 之 
后 将 出 现 该 程序 的 第 一 条 指令 ， 且 对 应 的 分 配 地 址 如 ORIG 参 数 所 示 。 同 时， 我们 还 采用 了 一 个 地 
址 跟踪 计数 器 LC (Location Counter) ，LC 的 初始 值 由 .ORIG 指 定 ， 在 此 即 为 x3000。 

(3) 每 成 功 识别 出 一 条 有 效 指令 ，LC 增 量 (加 1)。 如 果 该 指令 行头 部 存在 “标识 ”字段 ， 则 
为 该 标识 创建 符号 表 项 即 二 元 组 [符号 ， 地 址 值 ]， 其 中 地 址 值 就 是 LC 计 数 器 的 当前 内 容 。 

(4) 继续 识别 下 一 行 指令 (3) ， 直 到 .END。 

第 1 个 出 现 标识 符 的 指令 行 是 第 13 行 。 由 于 它 是 程序 中 的 第 15 个 指令 ， 即 LC 当前 内 容 是 x3004， 


因而 为 其 创建 的 表 项 内 容 为 : 
Symbol Address 
TEST x3004 
第 2 个 包含 标识 符 的 指令 在 第 20 行 。 此 时 LC 内 容 已 被 增 景 为 x300B， 因 而 创建 的 表 项 内 容 为 ; 
Symbol Address l 
GETCHAR x300B 
5$ DIARI. fPedonBUÉ UE: 
Symbol Address 
TEST x3004 
GETCHAR x300B 
OUTPUT x300E 
ASCII x3012 
PTR x3013 


7.3.4 $8238. 生成 机 器 语言 程序 

第 2 遍 扫描 仍 将 再 次 扫描 整个 汇编 程序 ， 只 不 过 这 次 有 了 符号 表 的 帮助 。 在 这 次 扫描 中 ， 每 个 
有 效 指令 行 (而 不 是 注释 行 或 伪 操 作 行 ) 都 将 被 翻译 成 一 个 机 器 指令 。 

第 2 遍 扫 描 的 具体 操作 如 下 所 述 ， 
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(1) 第 01~09 行 再 次 被 汇编 器 丢弃 (因为 它们 是 注释 )。 
(2) 第 04 行 是 伪 操 作 .ORIG， 因 而 LC 被 初始 化 为 x3000。 

(3) 随后 ， 汇 编 器 移 至 0B 行 并 生成 机 器 指令 0101010010100000。 

(4) 随后 移 至 0C 行 ， 这 次 第 0C 行 将 顺利 通过 ， 因 为 事先 已 知 PTR 的 对 应 地 址 为 x3013。 由 于 是 
LD 指令 ， 所 以 机 器 指令 字 的 操作 码 字 段 为 0010， 目 的 寄存 器 字段 (R3) 填写 为 011，PCoffset 字 段 
则 需 稍 做 计算 。 已 知 PTR 对 应 地 址 x3013 且 当前 增 量 PC 值 如 LC+1 所 示 ( 即 x3002)， 由 于 PTR 地 址 值 
(x3013) 等 于 增 量 PC (x3002) 和 符号 扩展 后 PCoffset 值 之 和 ， 因 而 等 式 求 解 推出 PCoffset 字 段 内 容 
为 x0011。 将 所 有 字段 拼装 ，x3001 得 到 机 器 指令 字 0010011000010001， 同 时 LC 自动 增 量 为 x3002。 

注意 ，LD 指 令 中 源 操作 数 的 地 址 (BUPTR) 不 能 超出 LD 指 令 所 在 位 置 的 +256 或 -255。 换 名 
话说 ， 如 果 PTR 的 地 址 大 于 LC+1+256 或 小 于 LC+1--255， 则 该 偏 移 值 就 超出 了 指令 bit[8:0] 字 段 所 
能 表示 的 范围 。 当 然 ， 如 果 这 种 情况 出 现 了 ， 汇 编 器 会 判断 出 来 ， 并 将 终止 汇编 过 程 。 幸 运 的 是 ，. 
本 例 中 PTR 和 LD 指 令 的 间隔 距离 并 不 远 ， 所 以 该 指令 顺利 通过 汇编 。 

随后 ， 继 续 第 2 遍 扫 描 ， 且 每 推进 一 步 LC 增 量 (加 1)。 同 时 ，L€ 指 向 的 地 址 被 填 入 翻译 的 机 
器 代码 或 填 人 数值 (在 .FILL 情 况 下 )。 

直到 .END ， 第 2 人 遍 扫描 结束 。 翻 译 后 的 最 终 程序 如 图 7-3 所 示 ， 




















Address Binary 
0011000000000000 
X3000 0101010010100000 
x3001 0010011000010001 
x3002 1111000000100011 
x3003 l 0110001011000000 
x3004 0001100001111100 
x3005 0000010000001000 
x3006 1001001001111111 
x3007 0001001001000000 
x3008 1001001001111111 
x3009 0000101000000001 
x300A 0001010010100001 
x300B 0001011011100001 
x300C 0110001011000000 
x300D 0000111111110110 
x300E 0010000000000011 
x300F 0001000000000010 
x3010 1111000000100001 
x3011 1111000000100101 
x3012 0000000000 110000 









0100000000000000 





x3013 


图 7-3 图 7-2 中 汇编 程序 所 对 应 的 机 器 语言 程序 


但 是 ， 即 使 在 心情 很 好 的 情况 下 ， 这 个 处 理 过 程 也 是 无 聊 透 顶 的 。 幸 运 的 是 ， 我 们 并 不 需要 
亲自 操作 这 个 过 程 ， 因 为 LC-3 汇 编 器 程序 就 是 用 来 完成 这 个 任务 的 。 有 了 LC-3 汇 编 语言 ， 你 就 不 
必 再 编写 枯 爆 的 机 器 语言 程序 了 ， 而 有 了 汇编 器 程序 ， 又 省 去 了 繁琐 的 翻译 过 程 。 换 句 话说 ， 我 
们 用 LC-3 汇 编 语 言 编程 ， 然 后 让 LC-3 汇 编 器 将 其 翻译 成 机 器 语言 版 本 的 、 可 以 在 LC-3 计 算 机 上 执 
行 的 程序 。 

7.4 相关 知识 

本 章 从 计算 机 的 ISA 层 向 上 又 提高 了 一 层 ， 即 汇编 语言 。 虽 然 这 距离 C 或 C++ 等 高 级 语言 还 很 

远 , 但 事实 上 ， 我 们 看 到 汇编 语言 已 省 去 了 不 少 麻烦 。 同 时 ， 我 们 还 介绍 了 二 次 扫描 编译 器 将 讶 
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编 语言 程序 翻译 成 LC-3 ISA 机 器 语言 的 原理 和 过 程 。 

但 是 ， 本 章 并 未 展开 讨论 汇编 语言 编程 中 的 更 多 高 级 技术 。 在 本 书 中 ， 有 关 汇 编 语 言 的 讲述 
并 不 是 研究 其 技术 细节 ， 而 是 介绍 其 简洁 性 的 一 面 。 

下 面 ， 我 们 对 与 汇编 语言 相关 的 其 他 技术 内 容 做 一 个 概述 。 


7.4.1 可 执行 映像 


当 计 算 机 开始 程序 的 执行 时 ， 执 行 实体 (entity) 又 称 做 “可 执行 映像 ”(executable image), 
可 执行 映像 通常 是 由 多 个 相互 独立 的 模块 组 装 在 一 起 形成 的 ， 而 这 些 模块 通常 又 是 由 不 同 的 程序 
员 分 别 编 写 的 。 刚 才 ， 我 们 已 模拟 LC-3 汇 编 器 , 走 了 一 遍 汇 编 语言 程序 的 翻译 过 程 ， 但 是 ， 其 他 
模块 可 能 是 用 C 语 言 编写 的 ， 需 要 借助 C 编 译 器 (compiler) 才能 完成 翻译 过 程 。 另 外 ， 这 些 模 块 
中 ， 有 的 是 由 用 户 编写 的 ， 而 有 的 则 来 自 操作 系统 的 库 程 序 (library routine), 

所 有 这 些 模 块 在 组 装 之 前 ， 是 一 个 个 独立 的 目标 文件 〈 其 中 包含 着 机 器 ISA 形 式 的 指令 及 其 相 
关 数 据 ) ， 最 后 是 通过 链接 操作 将 这 些 目标 拼装 成 一 个 可 执行 映像 的 。 程 序 执行 的 时 候 ， 其 中 的 每 
条 指令 又 被 细 分 为 FETCH、DECODE、… 等 指令 周期 。 这 就 是 从 编程 语言 到 机 器 语言 及 指令 周期 
的 层次 细 化 。 


7.4.2 多 目标 文件 


如 前 所 述 ， 通 常 一 个 可 执行 映像 由 多 个 模块 (或 目标 ) 文件 组 成 。 事 实 也 如 此 ， 大 多 数 的 程 
序 都 会 大 量 调 用 操作 系统 提供 的 库 函 数 或 由 其 他 程序 员 编写 的 模块 S， 也 就 是 说 ， 最 后 的 可 执行 映 
像 是 由 多 个 目标 文件 (而 不 是 单个 目标 文件 ) 拼装 而 成 的 。 

下 面 ， 我 们 仍 以 字符 数 统计 程序 为 例 ( 即 统计 一 个 文件 中 特定 字符 出 现 的 次 数 )。 假 设 一 个 应 
用 程序 将 该 程序 作为 其 模块 之 一 ， 而 将 文件 输入 操作 实现 在 另 一 个 模块 中 ， 那 么 ， 文 件 的 起 始 地 址 
(如 图 7-2 的 2E 行 所 示 ) 在 此 程序 中 将 成 为 一 个 未 知 值 。 例 如 ， 我 们 将 第 2E 行 代码 改写 成 如 下 形式 ; 

PTR .FILL  STARTOfFILE 

这 意味 着 图 7-2 的 程序 将 无 法 通过 汇编 ， 因 为 符号 STARTofFILE 是 未 知 的 (第 1 过 扫描 生成 的 
符号 表 中 设 有 它 的 对 应 表 项 ) ， 怎 么 办 呢 ? 

解决 办 法 是 ， 如 果 LC-3 汇 编 语言 中 包含 如 .EXTERNAL 的 伪 操 作 ， 则 我 们 可 以 用 符号 
STARTofFILE 声 明 此 类 符号 ， 它 表明 在 本 程序 (或 模块 ) 中 ,没有 提供 该 符号 的 地 址 信息 。 声 明 
方式 如 下 ; 


.EXTERNAL STARTOf FILE, 

它 传 递 给 汇编 器 的 信息 是 ， 如 果 在 当前 文件 中 没有 发 现 STARTofFILE 的 对 应 地 址 信息 ， 还 不 
能 确定 是 个 编程 错误 ， 因 为 该 符号 的 地 址 可 能 在 另 一 个 外 部 (external) 模块 里 定义 了 。 换 名 话说 ， 
我 们 借用 LC-3 汇 编 器 提供 了 和 伪 操作 指令 “.EXTERNAL”， 将 STARTofFILE 声 明 为 .EXTERNAL 类 
型 ， 因 此 LC-3 汇 编 器 在 第 1 次 扫描 过 程 中 ,会 在 符号 表 中 为 STARTofFILE 创 建 一 个 符号 表 项 ， 但 在 
地 址 值 字段 填写 的 不 是 地 址 ， 而 是 一 个 特殊 标志 (标志 该 符号 由 另 一 个 模块 定义 ) ， 在 链接 阶段 
(link time) 即 所 有 模块 合并 之 际 ， 链 接 器 (Linker) 将 借助 其 他 模块 提供 的 STARTofFILE 符 号 表 
项 ， 重 新 修订 第 2E 行 的 内 容 。 

有 了 .EXTERNAL 方 法 ， 使 得 一 个 程序 模块 事先 可 以 显 式 地 引用 另 一 个 模块 里 的 符号 ， 然 后 内 
链接 器 完成 最 后 的 修补 工作 。 


日 ” 库 函 数 或 其 他 模块 都 是 目标 文件 格式 ， 而 不 是 源 代码 格式 。 一 一 译 者 福 
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7.5 习题 


7.1 


7.2 


7.3 


7.4 


7.5 


7.6 


假设 一 个 汇编 语言 程序 中 包含 了 以 下 两 条 指令 ， 汇 编 器 将 翻译 后 的 LDI 指 令 放 在 目标 模块 的 
x3025 位 置 。 问 汇编 过 程 结束 后 ，x3025 的 内 容 是 什么 ? 


PLACE -FILE X45A7 
LDI R3, PLACE 


假设 汇编 语言 程序 中 包含 下 面 的 指令 

ASCII 的 符号 表 项 的 内 容 是 x4F08， 问 该 指令 执行 之 后 ，R1 的 内 容 是 什么 ? 

ASCII LD R1, ASCII 

如 果 采 用 字符 串 ANBP 作 为 标识 〈label) ， 会 出 什么 问题 ? (提示 ; A os dfi ae FE A RO 
第 2 遍 扫 描 会 是 什么 情况 ? ) 

试 为 以 下 代码 写 出 在 汇编 器 处 理 下 符号 表 的 内 容 。 


.ORIG x301C 


ST R3, SAVE3 
ST R2, SAVE2 
AND R2, R2, #0 
TEST IN 
BRz TEST 
ADD R1, RO, #-10 
BRn FINISH 
ADD R1, RO, #-15 
NOT R1, R1 
BRn FINISH 
HALT 
FINISH . ADD R2, R2, di 
HALT 


SAVE3 .FILL X0000 
SAVE2 .FILL X0000 
.END 


a. 试 阅读 以 下 程序 ， 说 明 它 的 作用 。 


.ORIG x3000 


LD R2, ZERO 
LD RO, MO 
LD Ri, M1 
LOOP BRz DONE 
ADD R2, R2, RO 
ADD R1, R1, -1 
BR LOOP 
DONE ST R2, RESULT 
HALT 
RESULT .FILL x0000 
ZERO . „FILL x0000 
MO .FILL x0004 
M1 .FILL x0803 
END 


b. 程序 结束 后 ，RESULT 的 内 容 是 什么 ? 
(假设 ) 我 们 的 汇编 器 崩溃 了 ， 需 要 你 的 帮助 ! 请 创建 一 个 符号 表 ， 并 将 下 面 程序 中 标号 为 
D、BE、F 的 指令 手工 汇编 出 来 。 你 可 以 假设 在 这 个 模块 执行 之 前 ， 已 有 另外 一 个 模块 将 一 个 


正 数 放 人 了 E 中 。 
.ORIG x3000 
AND RO, RO, #0 
D LD R1, A 
AND R2, R1, #1 
BRp B 
E ADD R1, R1, £-1 
B ADD RO, RO, R1 
ADD R1, R1, #-2 


F BRp B 
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7.7 


7.8 


7.9 
7.10 


7.11 


7.12 


7.13 


ST RO, C 
TRAP x25 
A . BLKW 1 
c . BLKW 1 
END 


请 用 不 多 于 15 个 字 的 一 句 话 ， 解 释 上 面 这 个 程序 在 做 什么 。 

试 写 一 个 LC-3 汇 编程 序 ， 统 计 R0 寄 存 器 的 数值 中 包含 了 多 少 个 1， 并 将 结果 存 人 Ri1。 例 如 ， 
假设 RO 的 内 容 是 0001001101110000， 则 程序 执行 之 后 ，R1 的 内 容 等 于 6 
(0000000000000110)。 

一 个 工程 师 正在 调试 她 写 的 一 个 程序 。 当 她 看 到 下 面 代 码 时 ， 决 定 在 地 址 0xA404 处 放置 一 个 
断 点 (breakpoint)。 在 PC=0xA400 时 ， 她 将 所 有 寄存 器 清 0， 并 运行 程序 直到 遇 到 断 点 。 
Code Segment: 

0xA400 THIS1 LEA RO, THIS1 

OxA401  THIS2 LD R1, THIS2 

OxA402  THIS3 LDI R2, THISS 

0xA403 THIS4 LDR R3, RO, #2 

OxA404  THIS5 .FILL xA400 

试 写 出 遇 到 断 点 的 时 候 ， 寄 存 器 文件 的 内 容 (用 十 六 进 制 表示 )。 

伪 操 作 .END 的 作用 是 什么 ? 它 和 HALT 指 令 之 间 的 区 别 是 什么 ? 


下 面 代 码 片 段 中 存在 一 个 错误 。 请 找 出 错误 并 修复 它 。 
ADD R3, R3, #30 
ST R3, A 
HALT 

A .FILL #0 


该 错误 是 在 被 汇编 的 时 候 ， 还 是 在 LC-3 上 运行 的 时 候 ， 将 被 发 现 ? 

LC-3 汇 编 器 必须 能 够 将 ASCII 表 示 的 常数 转换 为 相应 的 二 进 制 数值 。 例 如 ，x2A 将 被 翻译 为 
00101010， 而 #12 被 翻译 为 00001100。 试 写 一 个 汇编 语言 程序 ， 将 从 键盘 读 入 的 十 进 制 或 十 
六 进 制 常数 (前 组 # 代 表 十 进 制 ， 前 缀 x 代表 十 六 进 制 ) 转换 为 二 进 制 数 表达 方式 ， 并 打印 出 
来 《假设 常数 表示 上 时， 十 进 制 或 十 六 进 制 的 数字 不 超过 两 个 )。 


阅读 以 下 代码 ， 试 解释 该 程序 的 目的 。 
.ORIG X3000 
AND R5, R5, #0 
AND R3, R3, #0 
ADD R3, R3, #8 
LDI R1, À 
ADD R2, R1, #0 
AG ADD R2, R2, R2 
ADD R3, R3, H-1 
BRnp AG 
LD RA, B 
AND R1, R1, R4 
NOT R1, R1 
ADD R1, R1, #1 
ADD R2, R2, R1 
BRnp NO 
ADD R5, R5, #1 
NO HALT 
B .FILL xFFOO 
A .FILL x4000 
END 


以 下 程序 的 目的 是 将 存放 在 内 存 A、B、C 中 的 内 容 相 加 ， 并 将 结果 存 入 内 存 。 但 是 ， 代 码 中 
存在 两 个 错误 。 试 找 出 错误 ， 并 分 别 解释 错误 会 在 汇编 时 还 是 在 运行 时 被 检测 出 来 ? 
Line No. 
1 


.ORIG x3000 
2 ONE LD RO, A 
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DNE p 
3 ADD R1, Rl, RO 
4 TWO LD RO, B 
5 ADD R1, R1, RO 
6 THREE LD R0, C 
7 ADD R1, R1, RO 
8 ST R1, SUM 
9 TRAP x25 
i0 A .FILL x0001 
11 B .FILL x0002 
12 C .FILL x0003 
13 D .FILL x0004 
i4 . END 


7.14 


a. 汇编 以 下 程序 〈 即 写 出 该 程序 的 机 器 代码 ) ; 
.ORIG x3000 
STI RO, LABEL 
OUT 
HALT 
LABEL ~ .STRINGZ "$" 
.END 


b. 程序 员 试图 将 % 符 号 显示 在 屏幕 上 ， 然 后 停机 (halt), 。 但 程序 员 混 淆 了 操作 码 (即使 用 了 
错误 的 汇编 指令 ) 。 请 将 程序 中 被 错误 使 用 的 一 个 操作 码 替换 为 正确 的 操作 码 。 

c. 原先 的 程序 (如 a) 的 执行 会 产生 奇怪 的 现象 。 产 生 错误 现象 的 原因 一 部 分 是 由 程序 员 的 
失误 造成 的 ， 另 一 部 分 归 因 于 R0 的 内 容 在 程序 执行 之 初 是 x3000。 试 解释 奇怪 的 现象 是 什么 
样 的 ， 以 及 为 什么 会 这 样 ? . 

假设 x4000 开 始 的 连续 内 存 空间 中 存放 了 一 个 整数 序列 ， 且 每 个 内 存单 元 存放 一 个 整数 。 该 
序列 的 结尾 数值 是 x0000。 阅 读 下 面 的 程序 ， 请 问 该 程序 的 目的 是 什么 ? 


.ORIG x3000 


LD RO, NUMBERS 
LD R2, MASK 
LOOP LDR Rl, RO, #0 
BRz DONE 
AND R5, R1, R2 
BRz Li 
BRnzp NEXT 
L1 ADD R1, Ri, R1 


STR R1, RO, #0 
NEXT ADD RO, RO, #1 
BRnzp  LOOP 
DONE HALT 
NUMBERS .FILL x4000 
MASK .FILL x8000 
- END 


假设 x4000 开 始 的 连续 内 存 空间 中 存放 了 一 个 非 负 整 数 序列 ， 且 每 个 内 存单 元 存放 一 个 整数 。 
每 个 整数 的 数值 范围 是 0~30000 (十 进 制 )， 结 尾数 值 是 -1。 阅 读 下 面 的 程序 ， 请 问 该 程序 


的 目的 是 什么 ? 
.ORIG x3000 
AND R4, R4, #0 
AND R3, R3, 80 
LD RO, NUMBERS 
LOOP LDR R1, RO, &0 
NOT R2, R1 
BRz DONE 
AND R2, R1, #1 
BRz L1 
ADD R4, R4, #1 
BRnzp NEXT 
Li ADD R3, R3, #1 
NEXT ADD RO, RO, #1 


BRnzp LOOP 

DONE TRAP x25 

NUMBERS .FILL x4000 ， 
.END 


假设 你 写 了 两 个 独立 的 汇编 语言 模块 ， 并 用 链接 器 将 两 者 结合 在 一 起 。 其 中 ， 每 个 模块 都 使 
用 了 标识 AGAIN， 但 没有 一 个 模块 中 包含 了 伪 操 作 .EXTERNAL AGAIN。 请 问 在 两 个 模块 
中 ， 同 时 使 用 标识 AGAIN 是 否 有 问题 y 为什么? 
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7.18 


7.20 


#7 È 


下 面 程 序 比较 两 个 相同 长 度 的 字符 串 。 第 一 个 字符 串 的 起 始 地 址 是 x4000， 第 二 个 字符 串 的 
起 始 地 址 是 x4100， 两 者 都 是 .STRINGZ 格 式 。 如 果 两 个 字符 串 相同 ， 则 程序 结束 时 R5=0。 
请 在 (a)、(b)、(c) 中 填充 指令 ， 完 成 该 程序 。 

假设 x4000 开 始 的 连续 内 存 空 间 中 存放 了 一 个 整数 序列 ， 且 每 个 内 存单 元 存放 一 个 整数 。 
该 序列 的 结尾 数值 是 x0000。 阅 读 下 面 的 程序 ， 请 问 它 的 目的 是 什么 ? 


-ORIG x3000 


LD R1, FIRST 
LD R2, SECOND 
AND RO, RO, #0 
LOOP  -------------- (a) 


NEXT AND R5, R5, #0 


DONE TRAP x25 
FIRST .FILL x4000 
SECOND .FILL x4100 


.END 
请 问 下 面 的 程序 执行 时 ， 标 识 LOOP 处 的 指令 会 被 执行 多 少 次 ? 

.ORIG x3005 

LEA R2, DATA 

LDR R4, R2, #0 
LOOP ADD R4, R4, #-3 

BRzp LOOP TRAP x25 
DATA .FILL x000B 


END 


下 面 的 模块 (a) 和 (b) 分 别 是 两 个 程序 员 写 的 LC-3 汇 编程 序 ， 两 者 的 目的 都 是 将 数值 
x0015 填 入 地 址 x4000。 请 问 两 者 的 本 质 区 别 是 什么 ? 


a. 


.ORIG x5000 

AND RO, RO, #0 
ADD RO, RO, #15 
STI RO, PTR 


HALT 
PTR .FILL x4000 
.END 
b. 
.ORIG x4000 
.FILL  x0015 
.END 


汇编 以 下 LC-3 汇 编 语言 程序 ( 写 出 机 器 码 ) : 


.ORIG x3000 
AND RO, RO, #0 
LD R1, MASK 
ADD R2, RO, #10 
LD R3, PTR1 
LOOP LDR R4, R3, #0 
AND R4, R4, R1 
BRzP NEXT 
ADD RO, RO, #1 
NEXT ADD R2, R2, H-1 
BRp LOOP 
STI RO, PTR2 
MASK .FILL x8001 
PTR1 -FILL . x4000 
PTR2 .FILL . x5000 
END 


请 问 程序 的 目的 是 什么 〈 用 不 多 于 20 个 字 来 描述 ) ? 
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7.22 LC-3 汇 编 器 必须 能 将 指令 的 助 记 (mnemonic) 操作 码 翻 译 成 二 进 制 操作 码 。 例 如 助 记 操作 
码 ADD 对 应 的 二 进 制 码 形式 为 0001。 写 一 个 LC-3 汇 编 语 言 程序 ， 提 示 用 户 输入 一 个 助 记 操 
作 码 (如 ADD)， 然 后 将 其 对 应 的 二 进 制 码 打印 到 屏幕 上 。 如 果 输 入 的 是 无 效 助 记 操 作 码 ， 
则 显示 错误 信息 。 

7.22 试 写 一 个 LC-3 汇 编程 序 ， 判 断 一 个 字符 串 是 否 是 “ 回 文 ”(palindrome)。 所 谓 “ 回 文 ”， 就 
是 正 读 或 反 读 结 果 都 是 一 样 的 。 例 如 ， 字 符 串 “racecar” 就 是 一 个 回 文 。 假 设 x4000 存 放 了 
一 个 格式 为 .STRINGZ 的 字符 串 。 判 断 该 字符 串 是 否 是 回 文 ， 如 果 是 则 R5 返 回 内 容 1， 如 果 
不 是 ， 则 R5 返 回 0。 填 充 (a)~(e) 处 的 指令 ， 完 成 整个 程序 。 


-ORIG x3000 
LD RO, PTR 


AGAIN LDR R2, R1, #0 


CONT | -------------- (a) 
LOOP LDR R3, RO, #0 
-------------- (b) 


YES AND R5, R5, #0 


BRnzp DONE 
NO AND R5, R5, #0 
DONE HALT 
PTR .FILL x4000 


7.24 我 们 的 本 意 是 让 以 下 程序 将 R3 内 容 左 移 4 个 bit， 但 程序 中 存在 错误 ， 请 找 出 错误 并 修正 。 


.ORIG x3000 
AND R2, R2, #0 
ADD R2, R2, #4 
LOOP BRz DONE 
ADD R2, R2, #-1 
ADD R3, R3, R3 
BR LOOP 
DONE HALT 
.END 


7.25” 伪 操作 .FILL xFF004 有 什么 问题 吗 ? 为 什么 ? 


第 8 章 输入 /输出 


至 目前 为 止 ， 我 们 还 设 有 提 到 计算 机 的 输入 /输出 部 分 ， 但 这 并 不 代表 它 不 重要 。 相 反 ， 从 第 4 
章 内 容 中 ， 我 们 获知 “输入 /输出 ”是 站 诺 依 曼 模型 中 的 一 个 重要 组 成 部 分 。 因 为 我 们 需要 找到 一 
种 方法 ， 将 待 处 理 的 信息 输入 到 计算 机 系统 中 ， 并 将 计算 结果 以 人 们 能 够 理解 的 形式 输出 。 图 4-1 
列举 了 各 种 不 同 的 输入 输出 设备 。 

另外 ， 在 第 5 章 提 到 ， 可 以 通过 TRAP 指 令 请 求 操 作 系 统 来 具体 完成 输入 输出 操作 。 图 5-17 给 
出 了 使 用 例子 ， 即 输入 (地址 0x3002) 和 输出 (地址 0x3010)。 

本 章 中 ， 我 们 准备 自己 写 代 码 来 完成 这 些 输 入 输出 操作 。 其 中 ， 输 入 设备 选择 键盘 ， 输 出 设 
备 选择 显示 器 。 选 择 这 两 个 设备 的 原因 在 于 ， 首 先 ， 它 们 是 最 简单 的 一 类 WO 设备 (大 家 都 非常 熟 
悉 的 ) ， 其 次 ， 通 过 它们 即 可 以 了 解 JO 概 念 和 操作 特性 (而 无 需 陷 入 一 些 不 必要 的 硬件 细节 )。 


8.1 输入 /输出 的 基本 概念 


8.1.1 设备 寄存 器 


通常 ， 我 们 可 能 认为 IO 设备 就 是 一 个 单一 的 外 部 实体 ， 如 键盘 和 显示 器 。 但 是 ， 跟 一 个 IO 设 
备 进行 交互 ， 却 不 是 想像 中 的 那么 简单 。 我 们 需要 和 多 个 设备 寄存 器 (device register) 打交道 ， 
即使 最 简单 的 MO 设备 ， 也 至 少 包含 两 个 寄存 器 : 一 个 用 来 保存 跟 计 算 机 之 间 传 输 的 数据 ， 另 一 个 
用 来 指示 当前 设备 的 状态 信息 ， 如 “设备 是 否 空间 ”或 “最 近 处 理 的 WO 任务 ”等 。 


8.1.2 内 存 映 射 VO 与 专用 MO 指令 


指令 访问 WO 设备 寄存 器 时 ， 需 要 明确 指明 目标 寄存 器 。 通 常 有 两 种 实现 方法 ， 一 些 计 算 机 厂 
家 (通常 很 少 ) 采用 专门 的 VO 指令 来 访问 ， 即 “专用 1/O 指 令 ” 方 式 ， 另 一 种 方法 《大 多 数 计算 机 
厂家 都 采用 ) 是 采用 内 存 操作 指令 来 完成 WO 操作 ， 即 “内 存 映射 /JO” 方 式 。 

1965 年 ，DEC 公 司 生 产 的 PDP-8 就 是 - - 台 采 用 “专用 1/O 指 令 ” 的 计算 机 。PDP-8 的 指令 长 度 
为 12 位 ， 其 中 前 3 位 表示 操作 码 。 如 果 操 作 码 的 值 为 110， 则 表示 该 指令 是 IO 指令 ， 鳃 余 9 位 则 代 
表 目 标 寄 存 器 和 具体 操作 。 

与 专用 WO 指令 相 比 ， 设 计 者 们 更 偏爱 内 存 指令 的 WO 操作 方式 ， 即 内 存 上 映射 MO。 例 如 ， 如 果 
load 指 令 的 目标 地 址 是 一 个 设备 寄存 器 ， 则 它 就 是 一 条 输入 指令 。 又 如 ， 一 个 store 指 令 的 目标 地 址 
是 一 个 设备 寄存 器 ， 则 它 就 是 一 条 输出 指令 。 

由 于 程序 员 使 用 与 内 存 访问 相同 的 指令 来 操作 IO ， 所 以 设备 的 每 个 输入 或 输出 寄存 器 ， 都 必 
须 有 一 个 与 内 存 中 位 置 相同 的 标识 方式 。 为 此 ， 在 ISA 的 内 存 地 址 空间 中 ， 专 门 划分 出 一 段 地 址 ， 
用 于 设备 寄存 器 的 标识 映射 。 换 名 话说 ，IMO 设 备 的 寄存 器 被 “映射 ”到 一 组 地 址 (这 些 地 址 是 分 
配给 IO 设备 寄存 器 的 ， 而 不 是 分 配给 内 存 位 置 的 )， 即 所 谓 的 “内 看 映 射 JO”(memory-mapped 
IO) 方式 。 

例如 ，PDP-11 指 令 集 的 地 址 空间 是 16 位 的 ( 即 2* 个 地 址 单元 )， 其 中 ， 最 高 3 位 为 111 的 地 址 分 
配给 W/O 设备 ， 即 可 以 有 2"* 个 地 址 单元 用 来 标识 1/O 设 备 寄存 器 ， 剩 下 的 57 344 个 地 址 单元 则 用 来 标 


识 内 存 。 
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LC-3 采 用 内 存 映射 10 方式 。 其 中 ，0x0000~0xFDFF 的 地 址 空间 用 于 标识 内 存 ， 
0xFE00~0xFFFF 则 保留 给 外 部 设备 使 用 。 表 A-3 列 出 了 LC-3 已 分 配 的 设备 寄存 器 地 址 ， 其 他 地 址 预 
留 以 后 使 用 。 


8.1.3 异步 /0 与 同步 I/O 


下 面 描述 打字 员 的 输入 字符 操作 。 打 字 员 每 次 键入 一 个 字符 时 ， 该 字符 的 ASCII 码 值 就 被 存 和 人 
键盘 输入 寄存 器 中 。 然 后 CPU 执行 load 指 令 时 ， 如 果 目 标 地 址 指向 键盘 输入 寄存 器 ， 则 将 该 ASCII 
值 读 入 计算机。 

与 CPU 相 比 ， 大 多 数 /O 设 备 的 速度 是 非常 缓慢 的 。 现 代 微 处 理 器 的 时 钟 频率 一 般 都 超过 了 
300MHz， 假 设 处 理 器 工作 频率 是 300MHz 频 率 ( 即 一 个 时 钟 周期 只 有 3.3ns)，CPU 执 行 load 指 令 占 
用 10 个 时 钟 周期 ， 则 处 理 器 从 输入 寄存 器 中 读 取 一 次 数据 仅 需 33ns。 但 是 ， 打 字 员 的 输入 速度 远 
达 不 到 CPU 读 取 数 据 的 速度。 思考 题 : 假设 每 个 单词 的 平均 长 度 是 6 个 字符 ， 如 果 要 赶 上 处 理 器 的 
读 取 速度 ， 试 问 打字 员 输 入 单词 的 速度 至 少 是 多 少 (参考 习题 8.3) ? 

我 们 可 以 通过 硬件 设计 方法 来 减 小 这 个 速度 差异 。 例 如 ， 设 计 一 个 系统 ， 该 系统 每 30 000 000 
个 时 钟 周期 读 取 一 次 ， 则 打字 员 每 分 钟 只 需 键入 100 个 单词 即 可 。 但 是 ， 这 种 设计 方式 下 ， 要 求 打 
字 员 和 硬件 保持 时 钟 同步 ， 这 显然 是 不 可 行 的 ， 因 为 打字 员 的 输入 速度 是 随时 变化 的 。 

那 该 怎么 办 呢 ? 问题 的 关键 在 于 IO 设备 和 处 理 器 的 工作 节奏 是 不 一 致 的 ， 因 此 我 们 称 MO 设 备 
和 CPU 之 间 是 异步 的 (asynchronous)。 许 多 外 设 和 处 理 器 之 间 的 交互 都 是 异步 的 ， 如 我 们 提 到 的 . 
键盘 和 显示 器 。 异 步 通信 方式 下 ， 需 要 通过 一 定 的 协议 或 握手 (handshaking) 机 制 来 控制 发 送 和 


“是 否 有 新 的 字符 输入 " 。 在 显示 器 输出 的 例子 中 ， 我 们 也 使 用 一 个 单 bit 状 态 寄存 器 ， 来 表示 最 近 
输入 的 字符 是 否 已 经 显示 在 显示 器 上。 | 

实现 同步 的 最 简单 的 方式 是 采用 标志 。 键 盘 状 态 寄存 器 中 的 标志 位 (Ready bit) 提供 了 最 简 
单 的 一 种 握手 机 制 ， 打字 员 每 键入 一 个 字符 ， 该 Ready 位 就 被 置 位 ， 而 每 次 处 理 器 读 取 之 后 ， 都 自 
动 将 该 Ready 位 清 零 。 所 以 ， 在 每 次 读 取 输 入 字符 之 前 ， 处 理 器 都 将 检查 该 Ready 位 ， 如 果 Ready 位 
为 0， 表 示 没 有 新 的 字符 输入 ， 处 理 器 将 不 再 读 取 输入 寄存 器 ,否则 表示 有 新 字符 输入 ， 则 处 理 器 
执行 load 指 令 ， 读 入 输入 寄存 器 中 的 ASCII 码 值 。 通 过 这 种 担 手机 制 ， 保 证 了 打字 员 和 处 理 器 之 间 
的 数据 传输 。 . 

另外 ， 如 果 打 字 员 输入 字符 的 速度 是 恒定 的 ， 我 们 还 可 以 将 硬件 设计 为 定期 (如 每 30 000 000 
个 时 钟 周期 ) 读 取 一 次 输入 寄存 器 。 那 么 ， 我 们 就 不 需要 Ready 位 了 ， 因 为 处 理 器 知道 在 30 000 000 
个 时 钟 周期 后 ， 必 然 有 新 字符 输入 。 由 于 打字 员 和 CPU 的 节奏 是 一 致 的 ， 因 而 不 需要 额外 的 同步 信 
息 。 如 果 是 这 样 ， 我 们 就 称 打字 员 和 处 理 器 的 交互 是 同步 的 (synchronously)。 


8.1.4 中断 驱动 与 轮 询 


处 理 器 和 打字 员 是 两 个 不 同 的 实体 。 虽 然 它 们 的 任务 不 一 样 (处 理 器 的 任务 是 执行 程序 ， 而 
打字 员 的 任务 是 向 计算 机 输入 数据 )， 但 是 它们 之 闻 仍 然 需 要 交互 ， 即 打字 员 输 入 的 数据 必须 交 给 
处 理 器 来 处 理 。 交 互 的 两 种 基本 方式 是 中 断 驱动 (interrupt-driven) 和 轮 询 (polling)， 它 们 之 间 
的 根本 区 别 在 于 双方 是 谁 控制 这 个 交互 。 以 键盘 和 CPU 之 间 的 交互 为 例 ， 如 果 由 键盘 来 控制 交互 
过 程 ， 则 处 理 器 只 顾 做 自己 的 事情 ， 当 键盘 数据 准备 好 时 ， 它 会 主动 通知 处 理 器 :“ 输 入 字符 的 
ASCII 值 已 存放 在 输入 寄存 器 中 ， 你 可 以 读 取 了 ! ”我 们 称 这 种 由 外 设 控制 的 交互 方式 为 “中 断 驱 
动 1JO”， 而 如 果 该 交互 过 程 由 处 理 器 控制 ， 则 处 理 器 必须 不 断 读 取 、 测 试 状态 寄存 器 内 容 ， 直 到 
Ready 位 被 置 位 ( 即 有 新 的 字符 输入 )， 于 是 从 输入 寄存 器 中 读 取 数 据 。 在 这 种 交互 方式 下 ， 处 理 


136 £83$ 


器 必须 反复 查询 ， 因 此 称 之 为 “ 轮 询 方式 的 IO 。 
在 8.2.2 节 中 ， 将 描述 轮 询 工作 方式 ， 在 8.5 节 中 ， 将 描述 中 断 驱 动 VO 方 式 。 


8.2 键盘 输入 
8.2.1 基本 输入 寄存 器 


我 们 知道 ， 将 字符 从 键盘 输入 到 计算 机 内 部 需要 两 个 条 件 ， 一 是 数据 寄存 器 ， 用 来 存放 键盘 输 
入 字符 的 ASCII 值 ， 二 是 同步 机 制 ， 即 用 来 告知 处 理 器 数据 已 准备 好 的 方法 。 其 中 ， 同 步 机 制 可 以 
通过 键盘 状态 寄存 器 来 实现 ， 如 果 是 这 样 ， 键 盘 就 需要 两 个 寄存 器 ， 其 一 是 键盘 数据 寄存 器 
(KBDR)， 其 二 是 键盘 状态 寄存 器 (KBSR)。 附 录 A 中 的 表 A-3 15 87 o 


列 出 了 这 两 个 寄存 器 的 地 址 ， 其 中 ，KBDR (数据 寄存 器 ) 的 EE jeon 


地 址 是 0xFE02，KBSR (状态 寄存 器 ) 的 地 址 是 0xFE00。 


虽然 键盘 的 数据 寄存 器 只 需要 8 位 ， 而 状态 寄存 器 仅 需要 1514 o 
1 位 ， 但 我 们 还 是 给 它们 分 别 分 配 了 两 个 16 位 的 空间 。 如 图 8-1 a £57 
所 示 ，KBDR 的 第 0~7 位 用 以 存储 输入 字符 的 ASCII 值 ，KBSR ”图 8-1 键盘 的 设备 寄存 器 
的 第 15 位 用 以 存储 同步 信息 (Ready 位 )。 


8.2.2 基本 输入 服务 程序 


KBSR[15] 的 作用 是 控制 处 理 器 (快速) 和 键盘 ORR) 之 间 的 同步 。 当 某 个 按键 被 按 下 时 ， 
该 键 对 应 的 ASCII 值 在 在 人 KBDRI7:0] 的 同时 ， 键 盘 硬 件 电路 自动 将 KBSR[15] 置 1 当 LC-3 读 取 
KBDR 时 ， 键 盘 自 动 清除 KBSR[15]。KBSR[15]=0 意 味 着 键盘 可 以 继续 输入 ， KBSR[15]=1， 意 味 
着 上 次 输入 字符 还 未 被 处 理 器 取 走 ， 即 键盘 无 法 继续 输入 其 他 字符 。 

在 轮 询 方式 下 〈 即 处 理 器 控制 的 MO) ， 程 序 将 反复 读 取 并 测试 KBSRI15] 位 ， 直 到 它 被 置 为 1。 
如 果 程 序 读 到 KBSR[15] 被 置 位 ， 处 理 器 就 将 KBDR 中 的 ASCII 值 拷贝 到 LC-3 内 部 的 一 个 本 地 寄存 
器 中 。 键 盘 的 任 一 输入 字符 不 应 该 也 不 会 被 重复 读 取 ， 这 是 因为 在 LC-3 读 取 KBDR 时 ， 键 盘 的 硬 
件 电路 会 自动 清除 KBSR[15]， 而 程序 仅 在 KBSR[15]=1 的 情况 下 ， 才 会 读 取 KBDR 的 内 容 。 另 外 ， 
键盘 在 前 一 个 输入 字符 被 取 走 之 前 是 被 禁用 的 ， 这 叉 保 证 了 已 输入 字符 是 不 会 丢失 的 。 由 此 可 见 ， 
KBSR[15] 的 同步 机 制 保 证 了 输入 字符 有 且 仅 有 一 次 被 读 取 的 机 会 。 

如 下 程序 的 功能 是 ， 将 键盘 KBDR 寄 存 器 中 的 ASCII 值 读 人 本 地 寄存 器 RO 中 ， 然 后 跳 转 至 下 一 


个 任务 
01 START LDI R1, A ; Test for 
02 BRzp START ; character input 
03 LDI RO, B 
04 BRnzp . NEXT TASK ; Go to the next task 
05 A .FILL XFEOO ; Address of KBSR 


06 B .FILL xFE02 ; Address of KBDR 

KBSRI15]=0 表 示 自 上 次 读 取 键 盘 之 后 ， 一 直 没有 新 的 输入 。 程 序 的 第 1，2 行 构成 KBSR[15] 位 
的 测试 循环 ，LDI 指 令 将 地 址 0xFE00 处 的 值 载 人 R1 (0xFE00 是 KBSR 寄 存 器 的 内 存 上 映射 地 址 )。 如 
果 KBSR[I15] 为 0， 则 程序 跳 加 START 继 续 循环 。 当 有 人 项 击 键盘 时 ， 则 该 键 的 ASCII 码 被 装 入 
KBDR ， 同 时 KBSR[15] 被 置 位 。 这 意味 着 程序 将 进入 第 3 行 代 码 ， 即 通过 LDI 指 令 将 地 址 0xFE02 处 
的 内 容 装 入 RO (0xFE02 是 KBDR 寄 存 器 的 内 存 映射 地 址 )。 于 是 读 取 键 盘 输入 过 程 完 毕 ， 程 序 无 条 
件 跳 转 至 NEXT_TASK。 


8.2.3 内 存 了 映射 输入 的 实现 
图 8-2 所 示 是 IO 内 存 映射 方式 下 的 数据 通路 。 基 于 第 5 章 的 介绍 ， 我 们 知道 数据 通路 在 完成 
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load 指 令 的 EXECUTE 节 拍 时 的 3 个 基本 步骤 为 : 
(1) 在 MAR 中 装 入 要 读 取 内 存 的 地 址 。 
(2) 启动 内 存 访问 ， 并 将 读 出 内 容 存 人 MDR。 
(3) 将 MDR 内 容 拷贝 至 目的 寄存 器 DR。 






[KBSR] [KBDR 


A 


在 内 存 映 射 方 式 下 ， 设 备 寄存 器 的 输入 步骤 和 内 存 读 操作 完全 一 样 。 只 是 内 存 读 取 时 ，MAR 
保存 的 是 内 存 地 址 ， 而 内 存 映射 输入 时 则 是 设备 寄存 器 地 址 。 同 样 ， 内 存 映 射 方式 下 MDR 的 装 人 
内 容 来 自 设备 寄存 器 ， 而 内 存 读 取 时 则 来 自 内 存单 元 。 


8.3 显示 器 输出 
8.3.1 基本 输出 寄存 器 (DDR 和 DSR) 
显示 器 输出 和 键盘 输入 的 原理 相似 ， 只 是 在 显示 器 工作 中 ， 使 用 的 输出 数据 寄存 器 和 状态 寄 


存 器 分 别 是 DDR 和 DSR (而 键盘 操作 使 用 的 是 KBDR 和 KBSR)。 在 LC-3 中 ，DDR 和 DSR 的 内 存 映 


射 地 址 分 别 是 0xFE06 和 0xFE04。 

DDR 只 需要 用 8-bit 来 存放 数据 ，DSR 仅 需要 1 位 ， 用 来 同步 ， 这 些 都 与 KBDR 相 同 。 但 为 方便 
起 见 ， 我 们 仍然 为 DDR 和 DSR 分 别 分 配 了 16 位 的 空间 。 其 中 ，DDR 的 [7:0] 位 用 来 输出 字符 的 ASCI 
值 ，DSR[15] 位 用 来 表示 输出 同步 (Ready 位 )。 图 8-3 所 示 是 与 显示 器 相关 的 两 个 设备 寄存 器 。 


8.3.2 基本 输出 服务 程序 
DSR[15] 用 来 同步 处 理 器 (快速 ) 和 显示 器 (E). E 4s 87 o 


LC-3 将 单个 字符 的 ASCII 值 输出 到 DDR[7:0] 的 同时 ， 显 示 器 电 | DDR 


路 自动 清除 DSR[15]， 然 后 开始 DDR[7:0] 内 容 的 处 理 ， 当 显示 

器 完成 字符 到 屏幕 的 输出 之 后 ， 其 电路 将 自动 设置 DSRI15] 位 ， 15 14 

它 表示 处 理 器 可 以 继续 下 一 个 字符 的 输出 了 ( 即 DDRI[7:0] 空 间 “计时 时 是 时 时 or 
空间 了 )。DSR[15]=0， 表 示 显 示 器 “ 忙 ”(busy)， 当 前 仍 在 图 8-3 显示 器 的 设备 寄存 器 





图 8-2 内 存 映 射 输入 
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处 理 前 一 个 字符 ，DSR[15]=1， 意 味 着 显示 器 已 完成 前 面 的 工作 ， 目 前 空间 ， 处 理 器 可 以 进行 下 一 
个 字符 的 输出 。 

如 果 访 输出 过 程 由 处 理 器 来 控制 ， 则 意味 着 程序 需要 不 断 测试 DSR[15] 位 的 状态 。 通 常 的 处 理 
流程 是 : 首先 ， 检 测 DSR[15] 位 是 否 置 1!， 如 果 为 1， 则 处 理 器 输出 字符 的 ASCH 值 写 入 DDR[7:0] 中 ， 


并 启动 屏幕 显示 。 
下 面 这 段 代 码 是 将 RO 中 的 字符 输出 到 显示 器 上 : 
01 START LDI R1, A ; Test to see if 
0? BRzp START ; output register is ready 
03 STI RO, B 
04 BRnzp NEXT TASK 
05 A .FILL xFEOA4 ; Address of DSR 
06 B .FILL xFE0O6 ; Address of DDR 


该 代码 和 8.2.2 节 的 键盘 输入 程序 非常 相似 ， 第 1、2 行 循环 测试 DSR[15] 位 ， 如 果 DSR 被 置 位 ， 
表示 显示 器 已 经 完成 前 一 次 的 字符 输出 工作 。 第 1 行 的 LDI 指 令 将 地 址 09xFE04 处 的 值 装 入 R1 
(0xFE04 是 DSR 寄 存 器 的 内 存 映射 地 址 )， 如 果 DSR[15] 没 有 置 位 ， 程 序 跳 回 START 重 新 执行 。 显 
示 器 完成 字符 输出 之 后 ， 将 自动 置 位 DSR[15]， 此 时 程序 将 跳 到 第 3 行 。STI 指 令 将 RO 中 的 ASCII 值 
输出 到 0xFE06 地 址 (DDR 的 内 存 映 射 地 址 )， 同 时 硬件 电路 将 自动 清除 DSR[15] 位 ， 这 就 保证 了 只 
有 显示 器 完成 当前 字符 输出 之 后 ， 才 能 接收 新 的 数据 。 输 出 完成 之 后 ， 程 序 转 去 执行 其 他 任务 。 


8.83.8 内 存 映 射 输出 的 实现 


图 8-4 所 示 是 内 存 映射 输出 的 数据 通路 。 与 之 前 讨论 的 内 存 映射 输入 一 样 ， 只 需要 在 原先 内 存 
访问 数据 通路 的 基础 上 ， 添 加 很 少 的 控制 逻辑 ， 就 可 以 实现 设备 寄存 器 的 访问 。 

















图 8-4 内 存 映射 输出 


根据 第 5 章 学 到 的 知识 ， 我 们 知道 ，store 指 令 的 EXECUTE 节 拍 执行 下 面 3 个 步 又 ， 

(1) 在 MAR 中 装 和 要 被 写 人 的 内 存 地址 。 

(2) 在 MDR 中 装 人 数据 。 

G) 等 待 内 存 写 操作 完成 (将 MDR 内 容 写 和 人 MAR 所 指向 的 内 存单 元 )。 

内 存 映射 方式 下 ， 设 备 输 出 的 操作 与 上 面 代码 相似 。 所 不 同 的 是 ， 此 时 MAR 的 内 容 是 设备 寄 
存 器 地 址 (而 不 是 内 存 地 址 )， 控 制 逻辑 使 能 (enable) 的 是 设备 寄存 器 而 不 是 内 存单 元 。 

图 中 同时 也 包括 了 内 存 映射 的 输入 部 分 ， 这 是 因为 输出 操作 也 需要 寄存 器 读 操 作 。 如 8.3.2 节 指 
出 的 ， 只 有 DSR 的 Ready 位 置 1 上 时， 处 理 器 才能 向 DDR 写 人 新 字符 。 参 见 代码 的 第 IL、2 行 测试 一 一 读 
取 并 测试 DSR[15] 的 值 ， 如 果 MAR=0xFE04 (DSR 的 内 存 映射 地 址 )， 则 地 址 逻辑 单元 选择 DSR 作 
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为 MDR 的 输入 ，MDR 的 值 被 载 人 R1 寄 存 器 并 进行 测试 。 
8.3.4 例子 : 2407 


当 我 们 敲 键盘 的 时 候 ， 通 常 希望 知道 刚才 键入 的 字符 是 否 正确 。 如 果 有 “ 回 显 ”(echo) 功能 ， 
就 非常 方便 了 ， 即 将 刚才 键盘 输入 的 字符 ， 输 出 在 显示 器 上 。 下 面 的 程序 是 已 有 的 键盘 输入 和 显 
示 器 输出 等 两 个 程序 的 结合 ， 可 以 实现 回 显 功能 : 


01 START LDI R1, KBSR ; Test for character input 
02 BRzp START 

03 LDI RO, KBDR 

04 ECHO LDI R1, DSR ; Test output register ready 
05 BRzp ECHO 

06 STI RO, DDR 

07 BRnzp NEXT TASK 

08 KBSR .FILL xFEO0 ; Address of KBSR 

09 KBDR .FILL xFE02 ; Address of KBDR 

0A DSR .FILL xFE04 ; Address of DSR 

0B DDR . FILL xFEO06 ; Address of DDR 


8.4 一 个 更 复杂 的 输入 程序 


如 8.2.2 节 的 输入 程序 ， 在 实际 程序 中 它 只 占 很 小 的 一 部 分 ， 事 实 上 还 有 许多 问题 需要 考虑 。 
例如 ， 假 设 一 个 程序 需要 通过 键盘 输入 数据 ， 坐 在 机 器 前 面 的 用 户 怎 样 才能 知道 何 时 应 该 套 键 盘 
THE? 坐 在 那里 ， 用 户 无 法 知道 程序 运行 到 哪里 了 ， 甚 至 无 法 知道 程序 现在 是 否 真 的 在 运行 。 

为 了 让 用 户 知 道 程序 正在 等 待 用 户 的 输入 ， 计 算 机 可 以 在 显示 器 上 打印 提示 信息 ， 这 些 信 息 
又 称 提示 符 。 它 们 是 由 操作 系统 (显示 为 % 或 C:) 或 编辑 器 程序 (显示 为 :) 等 输出 的 。 

图 8-5 的 程序 片段 ， 将 通过 轮 询 机 制 读 取 键盘 输入 ， 该 例子 在 8.2.2 节 已 出 现 过 。 其 中 包括 了 一 
段 提 示 代 码 ， 告 诉 用 户 现在 可 以 输入 信息 了 。 下 面 是 我 们 的 代码 解释 。 

(1) 第 13~19 行 、25~28 行 的 代码 大 家 应 该 非常 熟悉 了 ， 这 是 8.3.4 节 的 键盘 字符 输入 和 回 显 
程序 。 

(2) 第 1~3、1D~1F 和 22~24 行 的 代码 则 上 暗示 了 该 程序 将 动用 寄存 器 R1、R2、R3。 由 于 在 我 们 
看 到 的 代码 中 将 使 用 这 些 寄 存 器 ， 同 时 又 担心 它们 在 之 前 可 能 存储 了 数值 ， 且 这 些 数值 在 当前 代 
码 结束 后 还 要 继续 使 用 ， 所 以 第 1~3 行 的 代码 负责 在 程序 执行 前 ， 将 R1、R2、R3 分 别 保存 到 . 
SaveR1、SaveR2、SaveR3 等 3 个 内 存单 元 中 (参见 第 22~24 行 ， 通 过 ,BLKW 伪 操作 码 分 配 内 存 的 操 
作 )。 程 序 完 成 之 后 ， 则 通过 第 1D~1F 行 恢复 寄存 器 的 原 值 。 

(3) 剩 下 第 5~8 行 、0A~11 行 、1A~1C 行 ， 以 及 29 和 2A 行 代码 。 这 些 代 码 负 责 输 出 提示 信息 
input a character>， 通 知 用 户 可 以 输入 信息 了 。 第 5~8 行 的 作用 是 将 ASCII 码 值 0xA 输 出 至 显示 器 。 
该 ASCII 码 代表 “换行 ”(hewline)。 大 多 数 的 ASCII 码 都 是 由 屏幕 可 见 的 。 但 是 ， 有 些 ASCII 码 对 
应 的 是 控制 字符 ， 如 0x0A。 它 们 的 作用 是 引发 动作 ， 如 0xA 的 作用 是 控制 显示 器 的 光标 ， 将 其 移 
动 到 下 一 行 开 始 ， 所 以 称 之 为 “ 接 行 符 ”。 当 然 ， 即 使 是 输出 0xA ， 之 前 也 需要 测试 DSR[15]。 如 
果 该 位 被 清 0， 就 表示 显示 器 “ 忙 ”， 程 序 继续 循环 (06 和 07 行 )， 直 到 DSR[15] 变 为 1， 跳 转 条 件 不 
满足 (07 行 )， 之 后 将 0xA 写 人 DDR 寄 存 器 。 

第 0A ~11 行 代码 输出 提示 符 “Input a character>” 到 屏幕 。 提 示 符 一 共 18 个 字符 ， 在 第 2A 行 代 
码 处 分 配 空间 ， 每 个 字符 占用 一 个 内 存单 元 ， 加 上 结束 标识 符 “0x0000”， 一 共 占 用 19 个 内 存单 元 。 

0C 行 代码 循环 测试 字符 串 结 束 符 (0x0000), ， 如 果 没 有 遇 到 结束 符 ， 并 且 DDR 空 亲 ， 第 OF 行 
代码 就 输出 信息 提示 符 到 DDR 寄 存 器 。 一 旦 过 到 结束 符 ， 程 序 就 知道 提示 符 输出 完毕 ， 转 而 跳 到 
第 13 行 执行 ， 等 待 用 户 的 键盘 输入 。 

当 用 户 从 键盘 输入 一 个 字符 后 ， 程 序 读 取 该 值 并 将 其 在 显示 屏 上 回 显 (第 13 一 19 行 )， 最 后 在 
输出 一 个 换行 符 〈 第 13 行 ) 后 ， 跳 到 其 他 地 方 执行 。 
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R1,SaveRi ; Save registers needed 
R2,SaveR2 ; by this routine 
R3,SaveR3 


R2,Newline 


R3,DSR 
L1 ; Loop until monitor is ready 


R2, DDR ; Move cursor to new clean line 


R1, Prompt ; Starting address of prompt string 
RO, R1, #0 ; Write the input prompt 

Input ; End of prompt string 

R3, DSR 

L2 ; Loop until monitor is ready 

RO, DDR ; Write next prompt character 
R1,R1,#1 ; Increment prompt pointer 

Loop ; Get next prompt character 


R3, KBSR 
Input ; until a character is typed 


RO, KBDR ; input character into RO 
R3,DSR 

L3 ; until monitor is reađy 
RO, DDR i input character 


R3,DSR 
L4 ; Loop until monitor is ready 


R2,DDR ; Move cursor to new clean line 
Ri,SaveR1. ; Restore registers 
R2,SaveR2 ; to original values 
R3, SaveR3 
BRnzp NEXT TASK ; Do the program's next task 


SaveR1  .BKLW i ; Memory for registers saved 
SaveR2  .BKLW 1 

SaveR3  .BKLW 1 

DSR .FILL xFEO4 

DDR .FILL xFEOG 

KBSR .FILL xFEO0 

KBDR .FILL  . xFEO2 

Newline .FILL x000A ; ASCII code for newline 
Prompt  .STRINGZ ''Input a character»'' 


图 8-5 _ LC-3 的 键盘 输入 例 程 





8.5 ”中断 驱动 MO 


由 8.1.4 节 我 们 知道 ， 处 理 器 可 以 通过 轮 询 方式 与 O 设 备 交 互 ， 这 是 一 种 由 处 理 器 控制 的 交互 
方式 。 同 样 ， 也 可 以 由 IO 设备 来 控制 该 交互 过 程 ， 即 “中 断 ” 方 式 。 参 见 8.2、8.3 和 8.4 节 中 的 轮 
询 例子 ， 它 们 都 有 一 个 共同 点 ， 即 都 需要 处 理 器 反复 测试 状态 寄存 器 (Ready 位 )。 直 到 Ready 位 被 
置 “1” 之 后 ， 程 序 才能 执行 输入 或 输出 指令 。 而 本 节 我 们 将 介绍 由 1/O 设 备 来 控制 的 交互 方式 。 


8.5.1 什么 是 中 断 驱动 /O 


中 断 驱动 oO 的 本 质 特 征 是 : IO 设备 〈 可 能 与 当前 运行 程序 相关 ， 也 可 能 完全 无 关 ) 能 够 实现 
下 列 功能 ，(1) 强行 中 止 当前 程序 的 运行 ， (2) 使 得 处 理 器 执行 JO 设 备 请 求 ， (3) 最 后 恢复 被 
中 断 程序 的 执行 ， 并 让 它 感觉 好 像 什么 事情 都 没有 发 生 过 一 样 。 中 断 发 生 时 ， 指 令 执 行 流 变 化 的 
三 个 阶段 如 图 8-6 所 示 。 
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Program A is executing instruction n 


Program A is executing instruction n«1 

Program A is executing instruction n+2 

: Interrupt signal is detected 

: Program A is put into suspended animation 

: The needs of the I/O device start being carried out 
: The needs of the I/O device are being carried out 
: The needs of the I/O device are being carried out 
: The needs of the I/O device are being carried out 
: The needs of the I/O device have been carried out 
: Program A is brought back to life 

Program A is executing instruction n+3 

Program A is executing instruction n«4 


tvNNNN pep 





图 8-6 中 断 驱动 O 方 式 下 指令 的 执行 流程 


对 于 被 中 其 程序 4 而 言 ， 中 断 发 生 或 没有 发 生 ， 并 不 产生 任何 影响 ， 即 中 断 既 不 改变 程序 A 的 
执行 流程 ， 也 不 影响 它 的 执行 结果 。 换 名 话说 ， 即 使 发 生 中 断 ， 程 序 A 本 身 的 执行 流程 仍然 如 下 : 





Program A is executing instruction n 

Program A is executing instruction n+i 
Program A is executing instruction n«2 
Program A is executing instruction n+3 


Program A is executing instruction n+4 


8.5.8 为 什么 要 引入 中 断 驱动 VO 


毫 无 疑问 ， 如 果 IO 操 作 采 用 轮 询 方式 ， 处 理 器 将 会 花费 大 量 时 间 探 测 Ready 标 志 位 。 而 在 中 
断 驱动 IO 方式 下 则 不 同 ， 如 果 没 有 中 断 发 生 ， 处 理 器 可 以 执行 其 他 程序 ， 当 中 断 发 生 时 ， 处 理 器 
才 暂 停 当 前 程序 ， 并 自动 调用 《由 硬件 完成 ) 相应 的 MO 处 理 程序 。 

例 8-1 设 想 有 一 个 程序 ， 从 键盘 读 取 长 度 为 100 的 字符 串 并 进行 处 理 。 如 果 用 户 的 键盘 输入 速 
度 是 每 分 钟 80 个 单词 或 480 个 字符 (平均 每 个 单词 有 6 个 字符 ) ， 即 每 0.125s 一 个 字符 。 再 假设 处 理 
这 100 个 字符 的 序列 需要 12.49999s， 试 问 连续 处 理 1000 个 这 样 的 字符 串 ， 需 要 多 少时 间 ? (为 什么 
选择 12.49999 昵 ? 这 是 为 了 使 得 结果 更 直观 。) 

我 们 可 以 采用 如 8.2 节 的 轮 询 方式 读 和 人 每 个 字符 。 如 果 是 这 样 ， 程 序 将 花费 很 长 时 间 等 待 下 一 
个 字符 的 输入 ， 读 人 100 个 字符 的 时 间 为 100 x 0.125 或 12.5s。 

相反 ， 如 果 采 用 中 断 方 式 ， 则 无 需 反 复 不 断 地 执行 LDI 和 BR 指令 以 等 待 用 户 输入 。 那 么 ， 中 
断 到 来 之 前 ， 可 以 忙 着 处 理 上 一 次 读 入 的 字符 串 。 只 是 在 中 断 到 来 之 时 ， 花 很 少 的 时 间 读 和 人 最 新 
的 输入 字符 。 假 设 从 IO 寄存 器 读数 据 需要 10 条 指令 ， 且 每 条 指令 的 执行 时 间 是 0.00000001 秒 ， 则 
读 取 一 个 字符 的 时 间 仅 为 0.0000001s，100 个 字符 的 读 和 时间 是 0.00001s。 用 户 输入 100 个 字符 需要 
12.5s， 但 中 断 方式 下 处 理 器 读 入 字符 串 的 时 间 仅 为 其 中 的 0.00001s (而 不 是 12.5s) ， 剩 下 的 
12.49999s 可 用 来 做 有 用 的 工作 ， 如 处 理 上 一 次 输入 的 字符 序列 。 

我 们 的 结论 是 : 采用 轮 询 方式 ， 完 成 100 个 字符 处 理 的 时 间 是 24.99999s (12.5s 用 来 读 人 100 个 
字符 ，12.49999s 用 来 处 理 字 符 序列 )。 采 用 中 断 方式 时 ， 完 成 任务 的 时 间 是 12.5s (0.00001s 用 来 读 
入 ，12.49999s 用 来 处 理 )。 如 果 处 理 1 000 个 这 样 的 序列 ， 则 轮 询 方式 需要 7h， 中 断 方式 只 需要 3.5h。 
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8.5.8 ”中断 信号 的 产生 


中 断 驱动 HO 包 括 两 部 分 内 容 ， 一 是 中 断 使 能 (enabling) 机 制 ， 即 IO 设备 是 如 何 通知 处 理 器 
的 〈 当 设备 有 数据 输入 或 其 输出 部 件 准 备 就 绪 时 ) ， 二 是 传输 机 制 ， 即 IO 数据 如 何在 处 理 器 和 设 
备 之 间 传 送 。 这 两 部 分 可 以 简单 地 描述 为 : (1) 产生 中 断 信号 ， 中 止 当前 执行 程序 ，(2) 处 理 该 
中 断 请 求 。 

我 们 很 快 将 介绍 第 一 部 分 内 容 。 我 们 将 看 到 ， 处 理 器 中 断 当 前 工作 ， 转 而 响应 中 断 请 求 ， 需 
要 考虑 和 执行 很 多 细节 工作 。 

第 二 部 分 内 容 的 介绍 要 推迟 到 10.2 节 才 会 开始 。LC-3 在 处 理 中 断 请 求 的 时 候 ， 需 要 用 到 堆栈 
(stack) 技术 ， 而 有 关 “ 堆 栈 ” 的 知识 ， 要 在 第 10 章 之 后 才 会 学 习 。 

设备 是 否 必需 ， 以 及 是 否 能 够 “中 断 ” 处 理 器 (也 即 第 一 部 分 内 容 )， 必 须 具 备 以 下 几 个 条 件 : 

(1) IO 设备 自身 确实 需要 服务 。 

(2) 设备 有 请 求 服务 的 权限 。 

(3) 设备 中 断 请 求 的 优先 级 高 于 当前 处 理 器 所 运行 程序 的 优先 级 。 

以 上 三 个 条 件 如 果 同 时 满足 ， 则 处 理 器 中 止 当前 操作 ， 并 响应 设备 的 中 断 请 求 。 

1. 来 自 设备 的 中 断 信号 

从 IO 设备 来 说 ， 中 断 信和 号 的 产生 条 件 如 上 面 列 出 的 前 两 项 所 示 ， 设 备 确 实 有 请 求 服务 的 需求 ， 
且 设 备 有 足够 的 请 求 权 限 。 

有 关 第 一 项 条 件 ， 我 们 在 轮 询 方式 中 已 经 提 到 ， 即 KBSR 或 DSR 寄 存 器 的 Ready 位 。 换 名 话说， 
如 果 WO 设 备 是 键盘 ， 它 表示 用 户 已 键入 一 个 字符 ， 需 要 被 服务 〈 即 被 读 取 ) ， 如果 1/O 设 备 是 显示 
器 ， 则 表示 之 前 字符 已 输出 到 屏幕 ， 请 求 继续 服务 〈 即 请 求 写 人 下 一 个 字符 ) 。 在 这 两 种 情况 下 ， 
WO 设备 都 通过 设置 状态 寄存 器 的 Ready 位 来 表示 “请 求 服务 ”。 

有 关 第 二 项 条 件 ， 是 指 “ 中 断 使 能 标志 ”。 处 理 器 通过 设置 该 标志 位 ， 控 制 VO 设 备 是 否 有 上 
报 中 断 的 权限 。 如 果 该 标志 置 !， 表 示 处 理 器 允许 设备 发 送 中 。 asus 0 
断 信 和 号， 否则 ， 表 示 处 理 器 禁止 接收 来 自 该 设备 的 中 断 信 号 。 KBSR 
通常 ， 状 态 寄存 器 中 包含 有 “中 断 允 许 标 志 ”(IE)。 如 图 8-7 所 传递 给 处 理 器 的 中 断 信和 号 
示 ，KBSR 和 DSR 的 第 14 位 即 为 中 断 允 许 标 志 ， 来 自 /O 设 备 的 
中 断 请 求 信号 是 斑 和 Ready 位 的 逻辑 与 “AND) 结果 。 "a o 


如 果 焉 标志 被 清 0， 则 无 论 Ready 标 志 是 否 置 位 ， 中 断 信号 DSR 
都 不 会 产生 。 此 时 ， 程 序 只 有 通过 轮 询 方式 ， 才 能 获知 设备 是 mcum 
否 已 准备 好 新 数据 的 传输 。 

如 果 IE 标 志 被 置 1, 表 示 该 设备 处 在 中 断 驱 动 IJO 工 作 方式 下 ， EST 中 断 使 能 位 及 其 用 法 
即 允 许 设备 发 出 中 断 。 一 旦 设备 准备 好 传输 新 数据 ，Ready 位 就 被 置 1， 设 备 就 会 产生 中 断 信号 。 

2. 中 断 优先 级 

IO 设备 中 断 的 第 三 项 条 件 是 ， 中 断 请 求 比 当前 运行 程序 更 紧迫 。 处 理 器 所 执行 的 每 条 指令 都 
必然 处 在 一 定 的 紧迫 级 别 下 ， 我 们 称 之 为 优先 级 。 

几乎 所 有 的 计算 机 都 定义 了 一 组 程序 优先 级 别 。 如 LC-3 定 义 了 8 个 优先 级 别 (PLO~PL7)， 其 
数值 越 大 对 应 的 优先 级 越 高 。 一 个 程序 的 PL 通常 与 请 求 运行 该 程序 的 PL ( 即 紧迫 度 ) 相同 。 如 果 
程序 当前 正 运行 在 一 个 特定 的 PL， 而 此 时 来 了 一 个 更 高 PL 级 别 的 计算 机 访问 请 求 ， 则 当前 这 个 优 
先 级 较 低 的 程序 将 被 挂 起 ， 直 到 更 高 优先 级 的 程序 完成 那个 请 求 之 后 ， 被 挂 起 的 程序 才 被 恢复 执 
行 。 例 如 ， 如 果 计 算 机 正在 执行 一 个 可 以 通宵 运行 的 工资 计算 程序 ， 由 于 它 有 足够 的 时 间 (一 束 
夜 ) 来 运行 ， 即 紧迫 度 不 高 ， 所 以 我 们 可 以 将 它 的 优先 级 设置 为 PLO， 而 如 果 正 在 运行 的 是 一 个 核 
电厂 发 电机 的 电流 浪 涌 (current surge) 控制 程序 ， 则 运行 优先 级 应 该 设置 为 PL6。 如 果 将 两 个 程 
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序 放 在 一 台 机 器 上 运行 ， 我 们 显然 希望 核电 厂 的 控制 程序 应 该 优先 于 工资 计算 程序 ， 以 免 核 运 转 
的 控制 延误 而 把 我 们 炸 成 碎片 。 

车 1/O 设 备 能 中 止 处 理 器 的 当前 运行 ， 并 启动 中 断 驱动 VO 请 求 ， 则 它 的 请 求 优先 级 必须 高 于 当 
前 运行 程序 的 优先 级 。 再 如 ， 如 果 是 发 送 E-mail 的 按键 输入 ， 我 们 则 不 希望 这 个 键盘 输入 能 够 “中 
断 ” 之 前 提 到 的 核电 力 控制 程序 的 运行 。 

下 面 我 们 将 看 到 ， 当 INT 信 和 号 产生 时 ， 处 理 器 是 怎样 暂停 当前 运行 而 去 响应 中 断 请 求 的 。 如 图 
8-8 所 示 ， 是 INT 信 号 的 产生 机 制 以 及 中 断 优先 级 在 其 中 起 了 作用 。 图 中 包含 了 多 个 设备 的 状态 寄 
存 器 ， 同 时 这 些 设备 也 处 在 不 同 的 优先 级 下 。 对 于 任何 设备 ， 如 果 它 的 状态 寄存 器 的 第 14、15 位 
同时 置 位 ， 则 该 设备 将 发 出 中 断 请 求 信 号 。 所 有 的 中 断 信号 又 将 被 输入 优先 级 编码 器 (一 个 组 合 
逻辑 电路 )， 从 中 选 出 优先 级 最 高 的 一 个 。 被 选 出 的 优先 级 如 果 比 当前 运行 程序 的 优先 级 高 ， 则 将 
成 功 生 成 INT 中 断 信 号 ， 并 中 止 当前 程序 。 


PLO 设备 PL1 设备 PL7 设备 





INT 


图 8-8 INT 信 号 生成 电路 


3. 中 断 检测 

中 断 驱动 /O 第 一 部 分 ( 即 中 断 产 生 ) 的 最 后 一 步 ， 是 处 理 器 对 该 中 断 信和 号 的 检测 。 从 第 4 章 
的 内 容 中 ， 我 们 知道 指令 的 执行 过 程 包括 6 个 节拍 : 取 指 令 (FETCH)、 译 码 (DECODE)、 地 址 计 
算 (EVALUATE ADDRESS)、 取 操作 数 (FETCH OPERAND)、 执 行 (EXECUTE) 和 存放 结果 
(STORE RESULT)。 前 一 条 指令 完成 “存放 结果 ”节拍 之 后 ， 控 制 单元 将 返回 第 一 节拍 ， 即 下 一 
条 指令 的 取 指 操作 。 

在 增加 了 中 断 信 号 检测 逻辑 之 后 ， 原 先 的 最 后 一 步 操作 一 从 前 一 个 SEORE RESULT 节 拍 总 
是 回 到 下 一 个 FETCH 节 拍 ， 将 出 现 变 化 : 在 STORE RESULT 的 同时 还 将 进行 中 断 信 号 INT 的 测试 。 
如 果 INT 未 被 设置 ， 则 一 切 如 旧 ， 控 制 单元 将 直接 返回 FETCH 节 拍 ， 如 果 INT 信 号 有 效 ， 则 控制 单 
元 在 回 到 FECTH 节 拍 之 前 ， 将 完成 两 项 工作 : 一 是 保存 足够 的 状态 信息 ， 以 备 以 后 能 正确 恢复 被 
中 断 程序 的 执行 环境 ， 二 是 将 即将 服务 于 该 设备 请 求 的 程序 人 口 地 址 装 人 PC 寄存 器 。 至 于 如 何 实 
现 这 些 操作 ， 是 10.2 节 的 话题 ， 我 们 将 在 了 解 了 栈 (stack) 技术 之 后 ， 再 学 习 该 内 容 。 
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8.6 ”内存 映 射 /O 的 回顾 


之 前 在 图 8-2 和 8-4 中 分 别 给 出 了 内 存 映 射 输入 和 内 存 映 射 输出 的 实现 。 现 在 我 们 知道 ， 如 果 要 
支持 中 断 驱动 TO， 设 备 状态 寄存 器 必须 是 可 读 、 可 写 的 。 

图 8-9 〈 同 附录 C 中 的 图 C-3) 所 示 的 数据 通路 ， 已 具备 了 访问 MO 设备 寄存 器 所 要 求 的 全 部 特 
性 。 其 中 ， 地 址 控制 逻辑 (Address Control Logic) 单元 控制 着 输入 、 输 出 操作 。 注 意 ， 该 模块 有 
三 个 输入 信号 ; (1) MIO.EN 指 示 当 前 指令 是 内 存 操作 还 是 VO 操作 ，(2) R.W 信 号 指示 是 读 操 作 还 
是 写 操作 ，(3) MAR 寄 存 器 中 保存 的 内 容 则 是 内 存 地 址 (内 存 操作 ) 或 /0 寄存 器 地 址 (1/O 操 作 )。 
基于 三 个 输入 信号 ， 地 址 控制 逻辑 负责 产生 相应 的 控制 信号 。 如 果 MIO.EN 为 0， 地 址 控制 逻辑 将 
不 做 任何 事情 ， 否则， 它 将 控制 MDR 和 内 存 或 /0 寄存 器 之 间 的 数据 传输 。 





图 8-9 内 存 映射 1O 方 式 下 的 数据 通路 


如 果 R.W 指 示 这 是 一 个 读 (load) 操作 ， 数 据 的 传输 方向 则 是 从 内 存 或 IO 寄存 器 至 MDR 寄 存 
器 。 同 时 ， 地 址 控制 逻辑 将 产生 控制 多 路 开关 INMUX 的 输入 源 选 择 信号 ， 即 选择 是 内 存 还 是 IO 状 
态 寄存 器 作为 MDR 的 输入 源 。 如 果 是 读 内 存 操作 ， 除 MAR 中 包含 了 内 存 地 址 之 外 ， 地 址 控制 逻辑 
还 将 产生 内 存 使 能 信号 (MEM.EN), 

如 果 R.W 指 示 这 是 一 个 写 (store) 操作 ， 数 据 的 传输 方向 则 是 从 MDR 寄 存 器 至 内 存 或 WO 寄存 
器 。 地 址 控制 逻辑 将 基于 MAR 的 内 容 ， 向 MAR 所 指向 的 内 存 模块 或 W/O 寄 存 器 发 送 相应 的 装 入 使 


能 (load enable) 信号。 


8.7 习题 


8.1 a. 什 么 是 设备 寄存 器 ? b. 什 么 是 设备 数据 寄存 器 ? c. 什 么 是 设备 状态 寄存 器 ? 
82 ”为 什么 同步 W/O 不 需要 Ready 标 志 位 ? 
8.3 回顾 8.1.3 节 中 的 例子 ， 如 果 CPU 工 作 频 率 为 300MHz， 即 每 33 纳 秒 就 能 处 理 一 个 字符 。 假 设 
每 个 单词 的 平均 长 度 为 6 个 字符 (包括 单词 之 间 的 空格 )， 求 打字 员 每 分 钟 要 输入 多 少 个 单词 才 
能 跟 上 CPU 的 处 理 速度 。 
8.4 请 问 下 面 的 交互 方式 是 异步 的 还 是 同步 的 ? 
a. 电视 和 遥控 器 之 间 的 交互 。 b. 收 件 人 和 邮递 员 通 过 邮箱 交互 。 
c. 鼠标 和 PC 之 间 的 交互 。 
再 问 ， 在 什么 条 件 下 ， 它 们 都 是 同步 的 ? 在 什么 条 件 下 ， 它 们 都 是 异步 的 ? 
8.5 试问 ， 键 盘 寄 存 器 KBSR 中 的 bit[15] 有 什么 作用 ? 
8.6 ”如 果 程 序 在 读 取 KBDR 寄 存 器 之 前 ， 不 检查 KBSR 寄 存 器 的 Ready 位 ， 会 出 现 什么 问题 ? 
8.7 下 面 哪 两 个 描述 合 在 一 起 ， 就 可 以 描述 8.2.2 节 描述 的 系统 ? 
a. 内 存 映 射 和 中 断 驱 动 的 IO。 b. 内 存 映 射 和 轮 询 IO。 
c. 专用 1/O 指 令 和 中 汤 驱动 的 /O。 d. 专用 IO 指令 和 轮 询 LI/O。 


输入 /输出 145 


8.8 试 编写 一 个 程序 ， 检 查 内 存 地 址 0x4000 的 值 。 如 果 该 内 存 地 址 存储 的 是 一 个 合法 的 ASCH 码 ， 
程序 就 在 屏幕 上 打印 这 个 ASCII 字 符 。 如 果 该 内 存 地 址 存储 的 是 一 个 非法 的 ASCII 码 ， 程 序 就 
什么 也 不 做 。 

8.9 ”如 果 键 盘 在 向 KBDR 寄 存 器 写 人 数据 之 前 ， 不 检查 KBSR 的 Ready 位 ， 会 发 生 什么 问题 ? 

8.10 如果 屏 幕 输出 电路 在 向 DDR 寄 存 器 写 人 数据 之 前 ， 不 检查 DSR 寄 存 器 的 Ready 位 ， 会 发 生 什 

么 问题 ? 

中 断 驱 动 IO 和 轮 询 方式 IO 相 比 ， 哪 一 个 效率 更 高 ? 为 什么 ? 

Adam 于 .设计 了 一 个 LC-3 计 算 机 的 变种 。 该 计算 机 的 键盘 不 需要 状态 寄存 器 。 相 反 ， 它 设计 

一 个 被 称 做 KBDSR 的 数据 状态 寄存 器 ， 该 寄存 器 包含 了 与 LC-3 的 KBDR 寄 存 器 完全 相同 的 

内 容 。 基 于 KBDSR 寄 存 器 ， 输 入 程序 只 有 在 KBDSR 内 容 不 为 0 的 时 候 ， 才 从 KBDSR 中 读 取 

数据 。 这 个 非 0 值 就 是 刚才 键盘 输入 字符 的 ASCII 码 值 。 在 数据 读 取 之 后 ， 程 序 将 清除 

KBDSR 寄 存 器 。 请 修改 8.2.2 节 的 代码 ， 以 使 之 能 够 适合 Adam 所 设计 的 方案 。 

有 一 些 计算 机 系 学 生 决 定 改进 LC-3 的 W/O 设计 ， 我 们 将 新 的 计算 机 称 为 LC-4。 在 LC-4 中 ， 它 

们 将 键盘 状态 寄存 器 KBSR 和 显示 器 状态 寄存 器 合并 为 一 个 寄存 器 : IOSR (输入 /输出 状态 

寄存 器 )。IOSR[15] 是 键盘 的 Ready 位 ，IOSR[14j 是 显示 设备 的 Ready 位 。 这 样 ， 程 序 需要 如 

何 实现 VO 操作 ? 评价 这 个 设计 方案 。 

一 个 LC-3 的 load 指 令 指定 的 地 址 是 0xFE02。 我 们 怎样 才能 知道 载 和 的 数据 是 来 自 KBSR 寄 存 

器 还 是 来 自 某 个 内 存单 元 ? 

关于 中 断 驱动 1/O: 

a. 下 面 这 段 代码 完成 的 是 什么 任务 ? 


x3000 
R3, 


8.11 
8.12 


8.13 


8.14 


8.15 


AGAIN LD 
xFEO0 


KBSR 


b. 假设 键盘 中 断 矢量 的 值 为 0x34， 内 存单 元 0x0134 的 值 为 0x1000。 键 盘 中 断 服务 程序 如 下 
所 示 ， 该 中 断 服务 程序 完成 什么 任务 ? 


8.16 


.ORIG 
LDI 
TRAP 
TRAP 
TRAP 
.FILL 

.END 


KBDR 


x1000 
RO, KBDR 
x21 

x21 

x25 
xFE02 


c. 如 果 程 序 (a) 执行 时 用 户 键 和 人 一 个 字符 ， 屏 幕 上 将 会 出 现 什 么 ? 
下 面 这 段 LC-3 程 序 完 成 的 是 什么 任务 ? 


AGAIN 


ASCII 
NEG 
DSR 
DDR 


x3000 
RO,ASCII 
R1,NEG 
R2,DSR 
AGAIN 
RO,DDR 
RO,RO, #1 
R2,RO,R1 
AGAIN 


x0041 
xFFB6 
xFEO4 
xFEO6 


7 -x004A 


第 9 章 TRAP 程 序 和 子 程序 


9.1 LC-3 TRAP 程 序 


9.1.1 概述 


在 前 一 章 图 8-5 所 示 的 代码 中 ， 程 序 要 从 键盘 读 取 输 入 ， 程 序 员 必须 了 解 以 下 内 容 ， 

(1) 数据 寄存 器 (键盘 和 显示 器 ): 用 于 确定 显示 器 的 数据 输出 和 读 取 键 盘 输 入 字符 的 位 置 。 

(2) 状态 寄存 器 (键盘 和 显示 器 ) : 用 于 确定 何 时 可 以 向 显示 器 输出 下 一 字符 ， 以 及 键盘 是 否 
有 按键 。 

(3) 键盘 输入 的 异步 工作 机 制 。 

” 对 于 大 多 数 应 用 程序 员 ， 这 些 知识 通常 超出 了 他 们 的 知识 范围 。 事 实 上 上， 如 果 要 求 一 个 应 用 程序 

员 (又 称 用 户 程序 员 ) 也 要 了 解 底层 1/O 操 作 ， 将 造成 WO 设备 减少 ， 从 事 程 序 员 职业 的 人 也 会 变 少 。 

赋予 用 户 程 序 员 直 接 读 写 KBDR 和 KBSR 等 WO 的 权限 ， 还 将 造成 男 一 个 问题 。1/O 操 作 的 设备 
寄存 器 通常 被 很 多 程序 共享 。 这 意味 着 ， 如 果 人 克 许 用 户 级 程序 员 直 接 读 写 硬件 寄存 器 ， 一 旦 这 些 
寄存 器 被 误 操作 ， 必 将 影响 其 他 用 户 程序 的 正常 执行 。 所以， 赋予 程序 员 这 种 权限 是 个 “ 轧 周 ” 
的 决定 。 通 常 ， 我 们 说 硬件 寄存 器 是 “有 特权 的 "， 是 指 它们 只 能 被 那些 有 合适 权限 的 程序 访问 。 

但 是 ， 特 权 的 概念 也 引发 很 多 复杂 问题 。 在 此 ， 我 们 暂 不 准备 对 其 展开 讨论 ， 有 关 处 理 机 制 将 在 
后 面 章节 论述 。 目 前 ， 我 们 只 需要 知道 有 一 些 资源 是 用 户 程 序 无 法 直接 访问 的 ， 它 们 只 能 被 一 些 特权 
程序 所 掌控 。 回 到 刚才 的 话题 ， 怎 样 为 用 户 程序 的 输入 和 输出 操作 找到 一 种 更 好 的 操作 办 法 呢 ? 

一 种 比较 简单 和 安全 的 解决 方法 ， 是 借助 于 TRAP 指 令 和 操作 系统 。 所 谓 “ 操 作 系统 ”， 就 是 
拥有 特权 权限 的 程序 。 

在 第 5 章 ， 我 们 曾经 介绍 过 TRAP 指 令 及 其 作用 。 对 于 一 些 特定 任务 ， 用 户 程序 可 以 通过 TRAP 指 
令 调用 操作 系统 帮助 完成 。 通 过 这 种 方法 ， 用 户 程序 员 不 需要 了 解 之 前 提 到 的 那些 复杂 细节 ， 而 其 他 
用 户 程序 也 不 会 因为 该 程序 员 的 失误 遭 致 破坏 。 用 户 程序 

如 图 9-1 所 示 ， 用 户 程序 在 x4000 地 址 处 ， 
将 要 执行 WO 任务 。 它 请 求 操作 系统 以 该 用 户 程 
序 的 身份 完成 这 个 任务 。 操 作 系 统 接 过 控制 权 ， 
分 析 并 处 理 TRAP 指 令 传 递 的 服务 要 求 ， 然 后 将 处 理 1/O 请 求 的 操 
控制 权 交 还 给 x4001 地 址 的 指令 。 我 们 称 这 种 用 
户 程 序 的 请 求 为 “服务 调用 ”(service call) 或 
“系统 调用 ” (system call), 


9.1.2 TRAP 机 制 


在 TRAP 机 制 中 ， 包 含 以 下 要 素 : 

(1) 服务 程序 (service routine) 集合 ， 由 操作 系统 提供 ， 但 以 用 户 身份 执行 。 这 些 服务 程序 
是 操作 系统 的 组 成 部 分 ， 起 始 于 各 自 固定 的 内 存 地 址 。LC- “最 多 可 以 支持 256 个 服务 程序 。 如 附录 
A 中 表 A-2 所 示 ， 它 是 完整 的 LC-3 操 作 系 统 服 务 程序 列表 。 


作 系 统 服务 程序 





图 9-1 使 用 TRAP 指 令 调 用 OS 的 服务 程序 
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(2) 起 始 地 址 表 : 包含 256 个 服务 程序 的 起 始 地 址 。 该 表 位 于 内 存 地 址 x0000~x00FF。 在 不 同 
的 操作 系统 中 ， 该 表 的 称 法 也 不 一 样 。 有 的 称 之 为 “系统 控制 块 ” 
(System Control Block), BRZA “AREK” (Trap Vector 
Table)。 图 9-2 所 示 是 LC-3 陷 和 人 矢量 表 的 快照 ， 其 中 给 出 了 各 矢量 
(服务 程序 ) 的 起 始 地 址 。 例 如 ， 地 址 x0021 的 内 容 是 字符 输出 服 
务 程 序 的 起 始 地 址 (x0430), ， 地 址 x0023 的 内 容 是 键盘 输入 服务 
程序 的 起 始 地 址 (x04A0) ， 地 址 x0025 的 内 容 是 机 器 挂 起 服务 程 
序 的 起 始 地 址 (xFD70)。 

(3) TRAP 指 令 ， 用 户 程 序 如 果 和 希望 操作 系统 以 用 户 程序 身 
份 执行 某 个 特定 的 服务 程序 ， 并 在 执行 结束 后 将 控制 权 返 回 ， 则 
可 以 使 用 TRAP 指 令 。 

(4) 链接 (linkage): 通过 链接 回 到 用 户 程 序 。 它 意味 着 操 
作 系 统 所 提供 的 ， 从 服务 程序 返回 用 户 程序 的 机 制 。 





图 9-2 陷入 (trap) 矢量 表 
9.1.3 TRAP 指 令 


在 执行 服务 程序 之 前 ，TRAP 指 令 需 要 先 完 成 两 件 事 : 
。 根据 陷 和 人 矢量 表 项 的 内 容 ， 将 PC 值 修 改 为 对 应 于 服务 程序 的 起 始 地 址 。 
。 提供 一 种 机 制 ， 返 回 到 调用 TRAP 指 令 的 程序 。 我 们 称 该 “返回 ”机 制 为 “链接 ” 
(linkage), 
“TRAP 指 令 ” 由 两 部 分 组 成 ， 操作 码 1111 和 陷 人 矢量 编号 (bit[7:0])。 位 [11:8] 必 须 为 0。 陷 入 
矢量 项 标识 了 用 户 程序 希望 操作 系统 执行 的 服务 程序 。 如 下 所 示 ， 陷 入 矢量 为 x23。 





TRAP trap vector 


TRAP 指 令 在 执行 时 ， 要 完成 4 件 任务 : 

(1) 将 8-bit 的 陷入 矢量 零 扩展 (zero-extend) 为 16-bit 地 址 ， 并 装 入 MAR。 例 如 对 于 陷入 矢量 
x23 来 说 ,扩展 后 的 地 址 就 是 x0023， 它 代表 某 个 陷入 矢量 表 项 的 地 址 。 

(2) 陷入 矢量 表 位 于 内 存 x0000~x00FF。 随 后 ， 表 项 x0023 的 内 容 被 读 入 MDR， 即 x04A0 (如 
图 9-2 所 示 )。 

(3) 将 当前 PC 值 存 人 寄存 器 R7， 以 实现 返回 用 户 程 序 的 链接 机 制 。 

(4) 将 MDR 的 内 容 装 入 PC。 至 此 ， 完 成 TRAP 指 令 。 

由 于 PC 的 内 容 目 前 为 x04A0， 因 而 程序 将 从 地 址 x04A0 开 始 ， 继 续 执行 。 

x04A0 指 向 的 是 操作 系统 “键盘 读 人 ”服务 程序 的 起 始 。 我 们 说 ， 该 陷 人 矢量 “指向 ”该 
TRAP 程 序 的 起 始 。 所 以 ，TRAP x23 指 令 的 作用 是 激活 操作 系统 的 “键盘 读 和 人 ”服务 程序 。 

TRAP 指 令 能 够 返回 用 户 程 序 下 一 条 指令 (服务 程序 结束 后 ) 的 前 提 是 ， 必 须 存 在 机 制 以 保存 
下 条 指令 的 地 址 。 如 上 所 示 ， 即 执行 阶段 的 步骤 3 实现 的 链接 功能 。 即 在 服务 程序 地 址 加 载 到 PC 之 
前 ， 先 将 原 PC 值 存 人 R7。 换 句 话说 ，TRAP 指 令 为 服务 程序 返回 用 户 程序 提供 了 所 有 必需 的 信息 。 
由 于 在 TRAP 指 令 的 预 取 阶段 ，PC 已 经 更 新 ， 指 向 下 一 条 指令 ， 所 以 在 trap 服 务 程序 开始 执行 时 ， 
R7 中 包含 的 就 是 TRAP 指 令 的 下 一 条 指令 地 址 。 


9.1.4 完整 机 制 
我 们 已 介绍 了 TRAP 指 令 激 活 服务 程序 的 细节 (对 用 户 程序 请 求 的 响应 ) ， 以 及 TRAP 指 令 提供 
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的 服务 程序 返回 用 户 程序 的 机 制 (链接 机 制 }。 下 面 我 们 将 介绍 在 服务 程序 中 ， 返 回 用 户 程序 所 使 
用 的 指令 。 回 顾 第 5 章 介绍 的 JMP 指 令 。 假 设 在 trap 服 务 程序 执行 过 程 中 ，R7 的 内 容 没有 改变 。 那 
么 ，trap 服 务 程序 最 后 只 要 执行 “JMP R7”， 就 可 以 返回 用 户 程序 。 

图 9-3 所 示 是 用 LC-3 TRAP 指 令 和 JMP 指 令 实 现 调 用 和 返回 的 示例 (参见 图 9-1)。 其 中 ， 先 是 
用 户 程序 的 4 (等 待 键盘 输入 字符 ) 转移 至 服务 程序 B， 然 会 返回 C (已 获取 键盘 读 入 字符 )。 


用 户 程序 陷入 矢量 表 


pl m 
A 


1111 0000 0010 0011 


图 9-3 从 用 户 程序 到 操作 系统 服务 程序 然后 返回 的 控制 流程 图 


我 们 将 借助 计算 机 指令 周期 中 的 概念 〈 取 指 、 译 码 等 )， 解 释 TRAP 机 制 的 实现 细节 。 我 们 知 
道 ， 若 要 改变 程序 控制 流程 ， 就 要 在 当前 指令 的 “执行 ”阶段 修改 PC 值 。 之 后 的 下 一 个 周期 ， 
CPU 将 从 新 地 址 处 读 取 指令 。 

因而 ， 如 果 要 请 求 字 符 输 入 服务 ， 我 们 只 需 在 用 户 程序 中 ， 调 用 TRAP 指 令 的 第 x23 号 矢量 即 
可 。TRAP 指 令 将 从 内 存 地 址 x0023 读 取 其 内 容 (x04A0)， 并 将 其 加 载 到 PC 中 ， 同 时 将 下 一 条 指令 
的 地 址 装 和 信 R7。 在 图 9-3 中 ， 虚 线 指向 的 是 包含 该 服务 程序 起 始 地 址 的 陷 人 矢量 表 项 。 

在 下 一 个 指令 周期 的 FETCH 节 拍 ， 将 从 x04A0 开 始 执 行 ， 即 请 求 (和 接受 ) 键盘 输入 的 操作 
系统 服务 程序 。 该 服务 程序 是 8.4 节 键盘 输入 程序 的 变种 (参见 图 8-5)， 其 中 RO 包含 的 是 输入 键 的 
ASCI 码 值 。 

该 trap 服 务 程 序 的 结尾 是 “JMP R7” 指 令 。 它 的 作用 是 将 R7 的 内 容 装 和 人 PC。 如 果 R7 的 内 容 在 
服务 程序 的 执行 过 程 中 没有 改变 ， 则 该 值 就 是 用 户 程序 中 TRAP 指 令 的 下 一 条 指令 的 地 址 。 随 后 ， 
用 户 程序 继续 执行 ，R0 包 含 的 则 是 刚才 输入 按键 的 ASCIHI 码 值 。 

在 trap 服 务 程 序 中 ，JMP R7 指 令 非常 有 用 (返回 用 户 程序 )。 为 此 ， 在 LC-3 汇 编 语 言 中 ， 专 为 
这 个 操作 定义 了 一 个 专用 指令 字 RET (简短 、 清 晰 、 方 便 记 忆 )， 如 下 所 示 : 

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 





字符 输入 服务 程序 






1100 000 111 000000 





RET 
如 下 所 示 是 一 段 使 用 TRAP 指 令 的 代码 。 它 非常 简单 、 有 趣 ， 可 供 4 岁 孩子 玩 要 。 
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在 这 个 程序 中 ， 存 在 这 样 一 个 前 提 假 设 : 用 户 只 会 大 写字 母 或 字符 “7”。 那 么 ， 如 果 用 户 输 
入 字符 “$” 会 有 什么 结果 呢 ? 对 此 ， 我 们 可 以 修改 例 9-1， 在 程序 中 检查 输入 字符 ， 以 确保 输入 字 
符 是 字母 表 中 的 26 个 大 写字 母 。 如 果 不 是 ， 则 执行 纠 错 操 作 。 

思考 题 ， 试 修改 该 程 序 ， 添 加 对 无 效 数据 检查 的 操作 。 换 句 话说 ， 程 序 应 保证 ， 如 果 输 入 是 
大 写字 母 ， 则 输出 对 应 的 小 写 形式 ， 如 果 是 其 他 字符 ， 则 程序 终止 。 见 习题 9.6。 


9.1.5 WO 中 断 处 理 程序 


我 们 只 要 将 如 图 8-5 所 示 的 输入 程序 稍 做 修改 ， 就 可 以 将 它 改 造 为 一 个 输入 服务 程序 。 修 改 后 
的 程序 如 图 9-4 所 示 。 其 中 的 两 个 修改 是 : (1) 增加 了 .ORIG 和 .END 这 些 伪 操 作 。.ORIG 指 定 了 该 
程序 的 起 始 地 址 (x04A0)， 即 陷入 矢量 表 x0023 的 内 容 ， (2) 将 图 8-5 第 20 行 所 示 的 “BR 
NEXT_TASK” 指 令 替 换 为 “JMP R7”( 汇 编 语言 助 记 为 RET) 。 之 所 以 是 JMP R7， 是 因为 该 程序 
是 通过 TRAP 指 令 调用 的 (而 不 是 普通 的 用 户 程序 )。 

另外 ，8.3.2 节 的 输出 程序 也 可 以 如 此 修改 。 修 改 后 的 输出 服务 程序 如 图 9-5 所 示 。 结 果 是 ， 我 
们 可 以 通过 TRAP 指 令 和 陷入 矢量 (编号 ) ， 调 用 这 些 输入 ( 见 图 9-4) 和 输出 ( 见 图 9-5) 服务 程序 。 
在 读 取 输 入 的 情况 中 ，TRAP x23 指 令 一 旦 结束 ，R0 包 含 的 就 是 键盘 输入 字符 的 ASCII 码 ， 而 在 输 
出 情况 下 ， 用 户 程序 只 需 将 要 显示 字符 的 ASCII 码 装 人 R0， 然 后 执行 TRAP x21 即 可 。 


150 X93* 













Service Routine for Keyboard Input 












02 i 

03 .ORIG — x04A0 

04 START ST R1, SaveR1 ; Save the values in the registers 
05 ST R2, SaveR2 ; that are used so that they 





R3,SaveR3 ; can be restored before RET 







R2,Newline 
09 L1 LDI R3,DSR ; Check DDR -- is it free? 
0A BRzp L1 

, R2, DDR 












; Move cursor to new clean line 











R1,Prompt ; Prompt is starting address 









OE ; of prompt string 

1F Loop LDR RO,R1,#0 ; Get next prompt character 

10 BR2 Input ; Check for end of prompt string 
11 L2 LDI R3,DSR 

12 BRzp LZ 

13 STI RO, DDR ; Write next character of 

14 ; prompt string 

15 ADD R1,R1,#1 ; Increment prompt pointer 






Loop 






Has a character been typed? 








Load it into RO 





; Echo input character 
to the monitor 






; Move cursor to new clean line 







23 LD R1,SaveRl ; Service routine done, restore 
24 LD R2,SaveR2 ; Original values in registers. 
25 LD R3,SaveR3 






Return from trap (i.e., JMP R7) 






SaveR1 1 









29 SaveR2 .BLKW 1 

2A SaveR3  .BLKW 1 

2B DSR .FILL xFEO4 

2C DDR .FILL xFE06 

2D KBSR .FILL xFEO0 

2E KBDR .FILL xFEO02 

2F Newline .FILL x000A ; ASCII code for newline 







Prompt  .STRINGZ "Input a character»" 


,END 
图 9-4 字符 输入 服务 程序 


.ORIG — x0430 ; System call starting address 
ST R1, SaveR1l ; R1 will be used to poll the DSR 
; hardware 





; Write the character 
TryWrite  LDI Ri, DSR ; Get status 

BRZp TryWrite ; Bit 15 on says display is ready 
WriteIt STI RO, DDR ; Write character 


; return from trap 
Return LD R1, SaveRl ; Restore registers 

RET ; Return from trap (JMP R7, actually) 
DSR -FILL xFEO04 ; Address of display status register 
DDR .FILL XxFEO06 ; Address of display data register 
SaveR1 .BLKW 1 

.END 





图 9-5 字符 输出 服务 程序 


9.1.6 HALT 中 断 程 序 


在 4.5 节 中 我 们 学 过 ， 通 过 RUN 锁 存 门 和 晶振 输出 的 “与 ”(AND) 逻辑 ， 可 以 控制 计算 机 的 
和 运行。 如果 RUN 锁 存 的 位 为 0， 则 “与 ” 门 输出 为 0， 即 传输 给 整个 计算 机 系统 的 时 钟 停止 。 
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在 早期 的 指令 集体 系 结构 中 ， 都 有 一 个 HALTI 指 令 ( 清 零 RUN 的 内 容 ) ， 可 用 来 停止 时 钟 。 但 由 
于 该 指令 的 使 用 频率 很 低 ， 为 它 分 配 一 个 操作 符 有 些 浪 费 (占用 一 个 指令 编码 空间 )。 所 以 ， 在 现代 
计算 机 中 ， 改 用 TRAP 指 令 方式 来 清除 RUN 门 。 在 LC-3 中 ，RUN 门 的 内 容 对 应 机 器 控制 寄存 器 ( 映 
射 内 存 地 址 xFFFE) 的 第 15 位 。 如 图 9-6 所 示 的 trap 服 务 程序 ， 即 可 停止 时 钟 ， 终 止 (halt) 处 理 器 。 


; Where this routine resides 












xFD70 





02 ST R7, SaveR?7 
03 ST R1, SaveRi ; R1: a temp for MC register 
04 ST R0, SaveRO ; RO is used as working space 









; print message that machine is halting 







RO, ASCIINewLine 






09 TRAP x21 
0A LEA RO, Message 
0B TRAP x22 






oc LD RO, ASCIINewLine 
x21 











; Clear bit 15 at xFFFE to stop the machine 





LDI ; Load MC register into R1 
12 LD RO, MASK ; RO = x7FFF 

13 AND RO, R1, RO ; Mask to clear the top bit 
14 STI RO, MCR ; Store R0 into MC register 













; return from HALT routine. 
17 ; (how can this routine return if the machine is halted above?) 





LD R1, SaveR1 ; Restore registers 
LD RÒ, SaveRO 

1B LD R7, SaveR? 
RET ; JMP R7, actually 






1E ; Some constants 


; 
20 ASCIINewLine 
21 $SaveRO 






24 Message — .STRINGZ "Halting the machine." 
25 MCR . FILL xFFFE ; Address of MCR 
26 MASK .FILL x7FFF ; Mask to clear the top bit 












27 .END 






图 9-6 LC-3 的 HALT 服 务 程序 


其 中 ， 第 02、03、04 行 负责 保存 R7、R1 和 R0 寄 存 器 的 内 容 。 之 所 以 保存 R1 和 R0， 是 因为 trap 
服务 程序 要 借用 它们 ， 保 存 R7， 是 因为 它 的 内 容 将 被 TRAP x21 (第 09 行 ) 覆盖 ， 随后， 第 08~0D 
行 负责 在 屏幕 上 输出 提示 信息 “正在 关机 ”(Halting the machine) ， 最 后 是 RUN 位 (MCR[I5]) 清 
除 操作 (第 11~14 行 )， 即 将 MCR 内 容 和 数值 “0111 1111 1111 1111” 相 “与 ”(AND)。MCR[14:0] 
保持 不 变 ，MCR[15] 变 成 0。 思 考题 ， 能 否 设 计 一 个 指令 (或 trap 服 务 程序 ) 来 控制 时 钟 的 开启 呢 ? 


9.1.7. 寓 存 器 内 容 的 保存 和 恢复 


在 前 面 的 内 容 中 ， 曾 不 断 地 强调 : 在 一 些 情况 下 ， 我 们 需要 显 式 地 保存 寄存 器 的 内 容 : 
。 如 果 该 寄存 器 的 内 容 会 被 后 续 操作 修改 。 


。 如果 在 后 续 操 作 中 将 使 用 该 寄存 器 。 
我 们 以 一 个 例子 讲解 它 的 重要 性 。 假 设 ， 程 序 从 键盘 读 人 10 个 数字 ， 然 后 将 ASCI 码 转化 为 二 


进 制 形式 ， 存 入 从 地 址 Binary 处 开始 的 10 个 连续 内 存 空间 。 如 下 所 示 : 


152 
01 LEA R3,Binary ; Initialize to first location 
02 LD R6,ASCII ; Template for line 05 
03 LD R7,COUNT ; Initialize to 10 
04 AGAIN TRAP x23 ; Get keyboard input 
05 ADD RO,RO,R6 ; Strip ASCII template 
06 STR RO,R3,H0 ; Store binary digit 
07 ADD R3, R3, #1 ; Increment pointer 
08 ADD R7,R7,H-1 ; Decrement COUNT. 
09 BRP AGAIN ; More characters? 
0A z BRnzp NEXT_TASK ; 
0B ASCII .FILL xFFDO ; Negative of x0030. 
oc COUNT .FXLL #10 
QD Binary .BLKW #10 


其 中 ， 程 序 的 第 一 步 是 初始 化 。 首 先 将 存储 10 个 数字 的 内 存 起 始 地 址 装 入 R3， 然 后 将 ASCII 模 
板 (ASCH template) 的 负 值 装 入 R6， 它 将 用 做 数字 减法 操作 ( 减 x0030) ， 随 后 ，count 的 初始 值 
10 装 人 R7。 之 后 是 10 次 循环 操作 : 每 次 从 键盘 读 人 一 个 字符 , 减 掉 ASCII 模 板 值 ， 存 储 二 进 制 结果 ， 
检查 是 否 完成 了 10 次 操作 。 听 起 来 一 切 正常 ， 但 是 我 们 发 现 该 程序 并 未 正常 工作 ,为 什么 ? SRE: 
每 次 执行 TRAP 指 令 (0447) 时 ，R7 的 内 容 都 将 被 修改 为 其 下 条 指令 “ADD RO. RO. R6” 所 在 的 地 
址 ， 这 破坏 了 原先 装 入 R7 的 count 的 值 (10)。 所 以 ， 第 08 和 09 行 代码 永远 无 法 结束 循环 过 程 。 

该 例子 给 我 们 的 启示 是 :一 个 寄存 器 的 原 内 容 ， 如 果 在 修改 为 其 他 值 之 后 还 要 被 使 用 ， 则 在 
修改 操作 之 前 ， 必 须要 将 原 值 保 厅 ， 修 改 之 后 再 将 其 恢复 。 保 存 的 方法 是 ， 将 寄存 器 内 容 存 人 内 
存 中 的 某 个 位 置 。 恢 复 时 ， 将 该 值 重 新 装 入 寄存 器 即 可 。 如 图 9-6 所 示 ， 第 03 行 的 ST 指令 将 R1 内 容 
存 和 人 内存， 第 11 行 的 LDI 指 令 修 改 了 R1 的 内 容 ，trap 服 务 程序 尾部 的 第 19 行 LD 指 令 则 将 调用 前 的 原 
值 装 入 R1。 其 中 ， 第 22 行 设置 的 就 是 存储 R1 的 内 存 空间 。 

有 关 保存 /恢复 问题 ， 既 可 以 由 调用 程序 在 TRAP 之 前 负责 ， 也 可 以 由 被 调用 者 〈TRAP 执 行 之 
JR) 来 负责 。 在 9.2 节 中 我 们 将 看 到 ， 同 样 的 问题 在 另 一 类 调用 /被 调用 程序 (TEF) 中 也 存在 。 

我 们 称 由 调用 程序 负责 该 问题 的 方式 为 “调用 者 保存 ”(callersave) 方式 ， 而 称 由 被 调用 者 负责 
的 方式 为 “被 调用 者 保存”(callee-save)。 选 择 最 合适 方式 的 原则 是 :“ 谁 (调用 者 或 被 调用 者 ) 知道 
谁 负责 。” 换 句 话 说 ， 对 于 特定 的 寄存 器 ， 谁 知道 该 寄存 器 的 内 容 会 被 修改 ， 则 由 谁 来 负责 保存 。 

对 于 被 调用 者 来 说 ， 由 于 它 知道 自己 的 程序 需要 使 用 哪些 寄存 器 。 所 以 ， 它 可 以 在 执行 开始 
之 前 ， 将 这 些 寄 存 器 的 内 容 依次 存 和 人 内存。 执行 结束 时 ， 再 将 这 些 原 值 恢复 至 寄存 器 。 为 此 ， 我 
们 在 内 存 中 预 留 了 空间 ， 以 供 寄存 器 值 存储 。 例 如 ， 在 图 9-6 中 ，HALILT 程 序 内 部 将 使 用 RO 和 R1。 
所 以 ， 第 03、04 行 的 ST 指令 负责 这 些 寄 存 器 值 的 保存 ， 第 19、1A 行 的 LD 指令 负责 恢复 ， 第 21、22 
行 是 备份 寄存 器 内 容 的 内 存 空间 。 

对 于 调用 者 来 说 ， 也 知道 在 它 的 操控 之 下 ， 哪 些 寄 存 器 的 内 容 会 被 毁坏 。 例 如 ， 仍 以 图 9-6 为 
例 ， 调 用 者 知道 TRAP 指 令 必 将 修改 R7 的 内 容 。 所 以 ，HALT 服 务 程序 在 TRAP 指 令 执行 之 前 ， 就 
将 R7 保 存 ， 然 后， 在 该 TRAP 指 令 执行 之 后 ， 恢 复 R7 的 原 值 。 


9.2 FEF 


现在 ， 我 们 看 到 ， 即 使 程序 员 不 了 解 MO 的 硬件 细节 ， 也 可 以 有 效 地 完成 很 多 编程 任务 。 只 是 ， 
这 些 都 依赖 于 操作 系统 所 提供 的 服务 程序 。 另 外 ， 我 们 也 曾 提 到 ， 让 操作 系统 来 访问 设备 寄存 器 ， 
可 以 避免 因 程 序 员 的 误 操作 而 产生 的 麻烦 。 

请 求 这 些 服务 程序 的 方法 很 简单 ， 仅 仅 是 调用 TRAP 指 令 ， 剩 下 的 事 则 由 操作 系统 来 处 理 。 最 
后 ， 服 务 程 序 通过 JMP R7 指 令 将 控制 权 交 还 给 用 户 程 序 。 

同样 ， 在 一 个 用 户 程序 中 ， 如 果 某 个 程序 片段 被 频繁 使 用 。 而 我 们 又 希望 ， 不 要 在 每 次 使 用 
时 ， 重 复 地 实现 这 些 细节 。 换 名 话说 ， 我 们 希望 代码 可 以 被 重复 地 使 用 。 又 如 ， 某 个 人 写 的 程序 
中 ， 调 用 到 另 一 个 人 所 写 的 代码 。 
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还 有 一 种 情况 是 ， 程 序 调 用 的 部 分 代码 是 由 生产 商 或 第 三 方 软件 商 开 发 的 。 并 且 ， 这 些 代码 
对 用 户 程序 员 是 可 用 的 ， 我 们 称 这 样 的 代码 集合 为 “ 库 ”(library)。 例 如 ， 数 学 库 就 是 一 个 例子 ， 
它 包 含 了 平方 根 、 正 弦 和 反正 切 等 运算 函数 。 

以 上 各 种 情况 都 表明 ， 是 否 存在 一 种 机 制 ， 可 以 帮助 我 们 有 效 地 享用 这 些 代 码 。 我 们 称 这 些 
代码 为 “ 子 程序 ”(subroutine) 或 “过 程 ”(procedure)， 而 C 语 言 的 术语 则 称 之 为 “函数 ” 
(function)。 它 们 的 使 用 机 制 则 被 称 为 “调用 /返回 机 制 ”(Call/Returmn machanism) 。 


9.2.1 调用 /返回 机 制 


在 图 9-4 中 ， 提 供 了 一 段 简单 的 程序 片段 ， 它 在 程序 中 将 被 多 次 调用 。 注 意 其 中 从 LI 标识 开始 
的 3 条 指令 ， 以 及 从 标识 L2、L3 和 L4 开 始 的 3 条 指令 。 这 些 指令 序列 的 形式 都 如 下 所 示 : 


LABEL LDI R3,DSR 
BRzp LABEL 
STI Reg,DDR 


这 4 段 代码 非常 相似 ， 只 是 在 STI 指 令 行 存在 区 别 。 其 中 ，2 个 存储 的 是 R0 的 内 容 ， 另 2 个 存储 
的 是 R2 的 内 容 ， 问 题 不 大 。 如 果 采 用 调用 /返回 机 制 ， 我 们 就 可 以 重复 多 次 地 执行 这 三 条 指令 序列 ， 
而 在 整个 程序 中 只 需 包 含 一 次 即 可 ( 子 程序 方式 ) 。 

调用 机 制 的 过 程 是 ， 首 先 计算 子 程序 的 开始 地 址 ， 并 将 其 装 和 人 PC， 然 后， 保存 调用 返回 地 址 
(下 一 条 指令 地 址 )。 在 返回 机 制 中 ， 将 把 返回 地 址 再 装 人 PC。 图 9-7 所 示 是 使 用 和 不 使 用 子 程序 等 


两 种 执行 过 程 的 比较 。 





a) 不 使 用 子 程序 b) 使 用 子 程序 


图 9-7 使 用 和 不 使 用 子 程序 的 指令 执行 流程 

调用 /返回 机 制 与 TRAP 指 令 的 执行 过 程 非常 相似 ， 两 种 情况 下 ， 都 是 先 保 存 返回 调用 程序 的 
链接 地 址 ， 然 后 将 程序 流 跳 转 至 代码 段 (服务 程序 或 子 程序 )。 其 中 ，PC 装 和 人 的 都 是 代码 段 的 起 始 
地 址 ，R7 装 人 的 则 是 返回 调用 者 的 链接 地 址 ， 代 码 段 的 最 后 一 条 语句 ， 无 论 是 在 中 断 服 务 程序 还 
是 子 程序 中 ， 都 是 JMP R7 指 令 ， 即 将 R7 的 内 容 装 人 PC， 从 而 将 控制 权 返 回 到 调用 者 。 

子 程序 和 服务 程序 之 间 的 主要 区 别 在 于 TRAP 指 令 。 也 许 这 个 话题 超出 了 本 课程 的 内 容 ， 不 
过 我 们 还 是 简要 讲 一 下 。 这 涉及 到 被 调用 代码 段 的 执行 特性 。 在 TRAP 方 式 下 ， 服 务 程序 动用 了 
操作 系统 资源 ， 因 而 具备 访问 计算 机 底层 硬件 的 特权 。 它 们 通常 由 系统 程序 员 编 写 ， 相 比 之 下 ， 
子 程 序 和 调用 程序 可 以 由 同一 个 程序 员 编 写 ( 可 以 是 你 的 同事 或 来 自 某 个 函数 库 )。 但 无 论 什么 
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情况 下 ， 它 们 使 用 的 资源 都 不 会 将 程序 的 其 他 代码 部 分 搞 混乱 ， 所 以 我 们 不 将 它们 看 做 是 用 户 程 
序 的 一 部 分 。 


9.2.2 JSR (R) 指令 


在 LC-3 中 ， 子 程序 调用 指令 的 操作 码 是 0100。 该 指令 的 寻 址 模式 〈 计 算 子 程序 的 起 始 地 址 ) 
有 两 种 : PC 相对 地 址 寻 址 和 基地 址 寻 址 。 在 LC-3 汇 编 语言 中 ， 两 种 模式 的 操作 码 相 同 ， 但 助 记 符 
不 同 (JSR 和 JSRR ) 。 

该 指令 完成 两 件 事 ， 首 先是 将 返回 地 址 存 人 R7， 然 后 是 计算 子 程序 起 始 地 址 并 装 人 PC。 返 回 
地 址 是 跳 转 前 已 经 递增 的 PC 值 ， 它 指向 调用 程序 中 紧 随 JSR (或 JSRR) 指令 之 后 的 那 条 指令 。 

JSR (R) 指令 由 三 部 分 组 成 : 


15 14 13 12 1 10 9 8 7 6 5 4 3 2 1 0 


其 中 ，bit[15:12] 代 表 操作 码 (0010) ，bit[11] 代 表 寻 址 模式 ， 访 bit 如果 为 1!1， 代 表 “PC 相 对 地 
址 寻 址 ”，0 则 代表 “基地 址 寻 址 ”，bit[10:0] 用 于 子 程序 起 始 地 址 的 计算 。 换 名 话说 ，JSR 和 JSRR 
之 间 的 惟一 区 别 ， 是 子 程序 起 始 地 址 的 寻 址 模式 。 

1.JSR 

在 JSR 指 令 中 ， 子 程序 目标 地 址 的 计算 方法 是 ， 符 号 位 扩展 (16-bit) 指令 字 中 的 bit[10:0]， 
然后 将 扩展 后 的 16-bit 与 递增 后 的 PC 相 加 。 该 寻 址 模式 与 LD 和 ST 的 寻 址 模式 几乎 一 样 ， 只 是 PC 的 
偏 移 量 是 11-bit， 而 LD 和 ST 指 令 使 用 的 是 9-bit。 

如 果 JSR 指 令 所 在 的 地 址 为 x4200， 那 么 该 指令 的 执行 结果 是 : PC = x3bE05, R7 = x4201。 

15 14 13 12 11 10 9 8 了 6 5 4 3 2 1 0 


JSR A PCoffset11 
2. JSRR 
JSRR 指 令 和 JSR 指 令 相似 (只 是 寻 址 模式 不 同 )。 它 们 计算 子 程序 起 始 地 址 的 方式 是 一 样 的 ， 
只 是 使 用 的 是 bit[8:6] 所 指定 寄存 器 的 内 容 。 
例如 ， 如 下 所 示 ， 假 设 ISRR 指 令 所 在 地 址 为 <420A，R5 的 内 容 为 x3002。 那 么 该 JSRR 指 令 的 
执行 结果 是 ，R7 = x420B，PC = x3002, 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 
JSRR A BaseR 


思考 题 : 在 JSRR 指 令 中 ， 它 具备 的 什么 特性 是 JSR 指 令 所 没有 的 ? 
9.2.38 字符 输入 的 TRAP 程 序 


下 面 ， 我 们 重新 看 一 遍 如 图 9-4 所 示 的 键盘 输入 服务 程序 。 特 别 注 意 其 中 地 址 标识 为 L1、L2、 
L3 和 L4 的 三 行 代码 ， 


LABEL LDI R3,DSR 
BRzp LABEL 
STI Reg, DDR 


试问 ， 我 们 可 以 用 JSR/RET 机 制 ， 将 4 处 代码 替换 为 一 个 子 程序 吗 ? 答案 “几乎 ”是 肯定 的 。 
图 9-8 所 示 是 修改 后 的 键盘 输入 服务 程序 。 其中， 第 05、0B 、11 和 14 行 的 代码 都 替换 为 如 下 
语句 ， 
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TRAP ££ fo FAA 
JSR WriteChar 
而 第 1D~20 行 是 新 加 的 4 条 语句 〈 子 程序 WriteChar) : 
WriteChar LDI R3,DSR 
BRzp WriteChar 
STI R2,DDR 


RET 


其 中 ，RET 指 令 (实际 上 是 JMP R7) 的 作用 是 ; 结束 子 程序 ， 返 回调 用 者 。 
注意 前 面 问题 的 回答 ， 用 到 的 修饰 词 是 “几乎 "。 原 因 是 ,在 从 L2 和 L3 开 始 的 代码 中 ，STI 指 
令 存 人 DDR 的 应 该 是 RO 的 内容 (而 不 是 R2 的 )。 不 过 ， 该 问题 很 容易 解决 ， 如 图 9-8 的 第 09 行 ， 我 


们 将 原来 的 
LDR R2,R1, #0 
替换 为 
LDR RO,R1,#0 


这 样 ， 即 将 提示 信息 字符 串 里 的 字符 装 入 了 R2。 然 后 ， 在 子 程序 WriteChar 中 ， 再 将 R2 中 的 字 


符 传人 DDR 。 
再 看 图 9-8 的 第 10 行 ， 我 们 插入 这 样 一 条 指令 ; 
ADD R2,RO, #0 


它 的 作用 是 将 键盘 输入 值 (在 RO 中 ) 装 人 R2。 然 后 ， 在 子 程序 WriteChar 中 ， 通 过 R2 传 人 
DDR. 注意 ， 此 时 在 R0 中 仍然 存 有 和 键盘 的 输入 值 。 另 外 ， 由 于 服务 程序 中 没有 修改 RO 的 操作 ， 所 


以 RO 将 一 直 存 有 键盘 输入 值 ， 直 到 返回 用 户 程 序 。 

而 在 图 9-8 的 第 13 行 ， 我 们 又 插入 了 指令 : 

LD R2, Newline 

它 的 作用 是 将 “换行 ”(newline) 字符 装 入 R2。 然 后 ， 通 过 子 程序 WriteChar 将 它 送 入 DDR 。 

最 后 ， 注 意 该 程序 与 图 9-4 所 示 程 序 的 不 同 。 由 于 在 该 中 断 服 务 程序 中 ， 含 有 很 多 JSR 指 令 。 
所 以 ，R7 所 包含 的 链接 地 址 ， 在 进入 服务 程序 之 后 很 快 就 被 修改 了 〈 如 第 03 行 的 JSR) 。 因 此 ， 我 
们 在 开始 执行 第 一 条 JSR 指 令 之 前 ( 即 第 02 行 )， 保 存 了 R7 的 内 容 ， 直 到 完成 最 后 一 条 JSR 指 令 之 


后 (第 16 行 )， 才 恢复 R7 的 内 容 。 
图 9-8 所 示 是 中 断 服务 程序 LC-3 键 盘 读 人 操作 的 完整 代码 。 


x04A0 
R7,SaveR? 
SaveReg 
R2,Newline 
WriteChar 
Ri,PROMPT 


R2,R1, #0 ; Get next prompt char 
Input 

WriteChar 

R1,R1, #1 

Loop 


ReadChar 
R2,R0O, #0 ; Move char to R2 for writing 
WriteChar ; Echo to monitor 


R2, Newline 
WriteChar 
RestoreReg 
R7,SaveR7 
; JMP R7 terminates 
the TRAP routine 


D 

SaveR7 . x0000 

Newline x000A 

Prompt .STRINGZ "Input a character»" 


WriteChar LDI R3, DSR 
BRzp WriteChar 
STI R2,DDR 
RET ; JMP R7 terminates subroutine 


图 9-8 提供 字符 输入 的 LC-3 trap 服 务 程 序 
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DSR xFEO4 
22 DDR .FILL xFEO6 





23 ; 
24 ReadChar LDI R3,KBSR 
25 BRzp ReadChar 





RO, KBDR 








xFEOD 
xFEO2 


KBSR 
KBDR 












R1,SaveRl 






SaveReg 








2c ST R2,SaveR2 
2D ST R3,SaveR3 
2b ST R4,SaveR4 
2F ST R5,SaveR5 






R6,SaveRé 











RestoreReg LD R1,SaveRi 















LD R2,SaveR2 
35 LD R3,SaveR3 
36 LD R4,SaveR4 
37 LD R5,SaveR5 
38 LD R6,SaveR6 
39 . RET 
3A SaveR1 -FILL x0000 
3B SaveR2 .FILL . x0000 
3c SaveR3 -FILL x0000 
3D SaveR4 . FILL x0000 
3E SaveR5 .FILL . x0000 
SaveR6 .FILL x0000 
END 





图 9-8 提供 字符 输入 的 LC-3 trap 服 务 程序 (2) 


9.2.4 PUTS. 写字 符 串 


有 关 图 9-8 所 示例 子 的 最 后 一 个 内 容 是 ， 第 09~0D 行 的 代码 ， 将 字符 种 “Input a character” 输 
出 到 显示 器 上 。 我 们 通常 称 一 个 字符 序列 为 “字符 事 ”(character string)。 这 段 代码 在 图 9-6 所 示 的 
代码 中 也 曾 出 现 过 ， 即 将 字符 串 “Halting the machine” 输 出 到 显示 器 。 由 于 在 用 户 程序 中 ， 经 党 
会 将 字符 串 输出 到 显示 器 。 所 以 ， 在 LC-3 操 作 系统 中 ， 为 此 专门 提供 了 一 个 对 应 的 陷入 矢量 。 如 
果 用 户 程序 需要 把 一 个 字符 串 输出 到 显示 器 ， 它 只 需要 提供 指向 该 字符 串 的 首 地 址 (在 RO 中 ) ， 然 
后 调用 TRAP x22 即 可 。 在 LC-3 汇 编 语言 中 ， 我 们 称 这 个 TRAP 操 作为 “PUTS”。 

PUTS (或 TRAP x22) 将 控制 权 交 给 操作 系统 ， 然 后 执行 如 图 9-9 所 示 的 代码 。 注 意 ， 只 需 对 
图 9-8 所 示 代 码 的 第 09~0D 行 代码 稍 做 修改 ， 就 可 以 得 到 PUTS 服 务 程序 了 。 


; This service routine writes a NULL-terminated string to the console. 
It services the PUTS service call (TRAP x22). 











i 












03 ; Inputs: RO is a pointer to the string to print. 

04 H 

05 .ORIG — x0450 ; Where this ISR resides 

06 ST R7, SaveR7 ; Save R7 for later return 

07 ST RO, SaveRO ; Save other registers that 

08 ST R1, SaveR1i ; are needed by this routine 
; 







09 R3, SaveR3 





; Loop through each character in the array 








i 
















oD Loop LDR R1, RO, #0 ; Retrieve the character(s} 
0E BRZ Return ; If it is 0, done 

OF L2 LDI R3,DSR 

10 BRzp ^ L2 

11 STI R1, DDR ; Write the character 
12 ADD RO, RO, #1 ; Increment pointer 

13 BRnzp Loop ; Do it all over again 
i4 ; 

15 ; Return from the request for service call 

16 Return LD R3, SaveR3 

17 LD R1, SaveR1i 





图 9-9 LC-3 的 PUTS 服 务 程序 


TRAP 4 fe FEF 


RO, SaveRO 
R7, SaveR?7 


D 
; Register locations 
.FILL 


DSR 

DDR .FILL 

SaveRO .FILL 

SaveR1 .FILL 

SaveR3 .FILL 

SaveR7 .FILL 
.END 


图 9-9 LC-3 的 PUTS 服 务 程序 ( 续 ) 


9.2.5 ERE 


我 们 注意 到 ， 在 本 节 前 面 的 很 多 地 方 ， 都 使 用 了 调用 /返回 机 制 。 
并 且 ， 我 们 认为 用 户 程序 所 调用 的 库 程 序 (library routine)， 应 该 属 
于 计算 机 系统 (而 不 是 应 用 程序 )。 之 所 以 提供 库 程序 ， 是 为 了 方便 
程序 员 在 不 需要 知道 内 部 细节 的 情况 下 ， 就 可 以 使 用 它们 所 提供 的 
功能 ， 所 以 我 们 将 它们 形象 地 称 为 “生产 力 提 高 者 ”(productive 
enhancer), 。 例 如 ,用 户 程序 员 知 道 平方 根 (简称 SQRT) 操作 的 含义 ， 
而 他 只 需 调 用 函数 sqrt(x)， 即 可 求 得 x 的 平方 根 值 ， 而 无 需 编 写 平方 
根 的 计算 代码 (甚至 根本 无 需 知道 怎样 编写 )。 

下 面 ， 我 们 看 一 个 简单 的 例子 。 假 设 办 公 室 的 钥匙 丢 了 ， 于 是 
放 了 一 把 梯子 靠 在 墙 上 ， 使 之 刚好 搭 在 窗户 的 下 沿 ， 且 窗户 距离 地 
面 的 高 度 是 24ftS。 但 是 ， 墙 边 有 一 个 10ft 高 的 花坛 ， 所 以 梯子 必须 
架 在 花坛 外 面 。 试 问 ， 我 们 需要 多 长 的 梯子 才能 息 和 人 窗户 呢 ? 换 句 
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梯子 


24ft 


10ft 
图 9-10 求 斜 边 长 度 的 问题 


话说 ， 直 角 三 角形 的 两 个 直角 边 分 别 为 24ft 和 10ft， 求 斜 边 长 度 ( 见 图 9-10 所 示 ) ? 


这 就 是 中 学 课本 中 的 毕 达 哥 拉 斯 (Pythagoras) 定理 9: 


=g +b 


如 果 已 知 a 和 bp， 则 求 42 和 ?之 和 的 平方 根 可 得 c<。 求 和 操作 比较 简单 ，LC-3 的 ADD 指 令 可 以 完 
成 。 平 方 也 不 难 ， 通 过 反复 的 加 法 可 得 两 数 的 乘积 。 但 是 ， 怎 么 计算 平方 根 呢 ? 如 图 9-11 所 示 ， 我 


们 给 出 了 问题 求解 的 程序 框架 。 


R0,SIDE1 


NEXT TASK 
R2,RO, #0 
R3, RO, #0 
R2,R2,s-1 
DONE 

RO, RO, R3 





图 9-11 计算 直角 三 角形 斜 边 的 程序 片段 


O 又 称 “ 勾 股 定理 ”"。 一 一 译 者 注 
© 英尺 (feet)，1ft = 0.3048m。 一 一 编者 注 
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; RO «-- SQRT(RO) 


; How do we write this subroutine? 


RET 
SIDEl .BLKW 
SIDE2 .BLKW 1 
HYPOT .BLKW 1 





图 9-11 计算 直角 三 角形 斜 边 的 程序 片段 ( 续 ) 


其 中 ,缺少 子 程序 SQRT 的 代码 。 在 没有 数学 库 的 情况 下 ， 程 序 员 就 要 拿 起 数学 书 (或 者 请 人 
帮忙 )， 学 习 Newton-Raphson 方 法 ， 完 成 该 计算 方法 的 编程 。 

但 是 ， 如 果 有 数学 库 (Math Libray)， 这 个 问题 就 简单 多 了 。 因 为 ， 数 学 库 提供 了 包括 SQRT 
在 内 的 很 多 子 程序 。 用 户 程 序 员 不 必 关 心 Newton-Raphson 之 类 的 内 容 。 惟 一 需要 知道 的 ， 就 是 平 
方 根 函 数 在 库 程 序 中 的 目标 地 址 ， 以 及 怎样 传递 参数 x 和 获取 SQRT(z) 的 计算 结果 。 通 过 查询 数学 
库 的 编程 手册 ， 我 们 很 容易 获得 相关 信息 。 

如 果 库 函数 在 内 存 中 的 开始 地 址 是 SQRT， 库 函数 要 求 的 参数 在 R0 中 ， 返 回 结 果 也 是 存 信 RO0 
中 。 那 么 ， 我 们 可 以 将 图 9-11 的 代码 简化 为 如 图 9-12 所 示 的 代码 。 


.EXTERNAL SQRT 


RO,SIDE1 
1$ 
SQUARE 
R1, RO, #0 
RO,SIDE2 


; RO contains argument x 





图 9-12 使 用 库 程 序 解决 图 9-10 问 题 的 程序 片段 


其 中 ， 有 两 件 事情 值得 一 提 : 

。 第 一 ， 在 本 代码 中 ， 程 序 员 不 再 担心 计算 平方 根 的 问题 了 ， 因 为 库 程 序 为 我 们 做 了 。 

。 第 二 ， 伪 操作 指令 .EXTERNAL 的 使 用 。 如 前 面 7.4.2 节 中 曾 介绍 过 的 ， 该 伪 操 作 指 令 的 作用 
是 告诉 汇编 器 在 本 程序 中 ， 如 出 现 符号 SQRT 的 引用 ， 它 将 由 外 部 程序 (或 模块 ) 提供 。 例 如 ， 
第 19 行 的 .FILL 伪 指令 中 出 现 的 SORT。 那 么 ， 在 最 后 的 可 执行 映像 生成 阶段 〈 即 链接 阶段 ) ， 编 译 


时 负责 将 本 程序 与 该 模块 链接 在 一 起 。 
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在 生成 可 执行 映像 时 ， 将 多 个 模块 链接 在 一 起 是 很 常见 的 情况 。 图 9-13 阐 述 了 这 个 过 程 。 我 
们 在 本 课程 的 第 二 部 分 ， 即 在 介绍 C 编 程 语言 的 工作 机 制 时 ， 将 看 到 更 具体 的 例子 。 
模块 A 的 源 程序 A 的 目标 模块 _ " 


.EXTERNAL SQRT 
Link 


可 执行 映像 








数学 库 的 符号 表 





其 他 独立 汇编 生成 的 
模块 


符号 表 





图 9-13 由 多 个 文件 构成 的 可 执行 映像 


在 很 多 应 用 软件 中 ， 都 将 大 量 使 用 各 种 各 样 的 库 程序 。 如 果 让 每 个 程序 员 都 亲自 编写 一 遍 这 些 库 
程序 ， 将 浪费 大 量 的 人 力 (假设 有 某 个 程序 员 已 为 这 个 函数 编写 了 非常 优秀 的 代码 )。 例 如 ， 我 们 曾 
提 到 ， 在 数学 库 中 有 很 多 能 够 绘制 “漂亮 ”图 像 的 预 处 理 程序 。 再 如 其 他 的 一 些 任务 程序 ， 如 果 让 每 
个 程序 员 都 从 头 编 写 ， 显然 是 没有 意义 的 。 简 单 的 方法 是 , 使 用 库 函 数 ， 而 我 们 所 需要 做 的 只 是 ;(1) 
用 合适 的 文档 清晰 地 描述 库 程序 与 调用 程序 之 间 的 接口 ，(2) 在 源 文件 中 ， 正 确 使 用 如 .EXTERNAL 
等 伪 指 令 。 最 后 ， 让 链接 器 负责 ， 将 各 个 独立 的 汇编 模块 链接 在 一 起 ， 生 成 可 执行 映像 。 
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9.3 习题 


9.1 
9.2 


9.3 


9.4 


9.5 


9.6 


9.7 


9.8 


试 阐述 通过 TRAP 替 代 自 己 编写 MO 操作 程序 的 优点 。 

试问 : 

a. 在 LC-3 中 ， 最 多 可 有 多 少 个 trap 服 务 程序 ? 为 什么 ? 

b. 为 什么 TRAP 程 序 返 回 时 必须 使 用 RET 指 令 ? 为 什么 不 能 是 BR (无 条 件 跳 转 ) 指令 ? 
c. 在 TRAP 指 令 的 处 理 过 程 中 ， 涉 及 多 少 次 内 存 访问 (假设 TRAP 已 在 了 中 ) ? 

阅读 如 图 9-6 所 示 的 HALT 服 务 程序 ， 回 答 下 列 问 题 ; 

a. 在 机 器 停止 之 后 ， 怎 样 启动 时 钟 ? (提示 : 在 HALT 服 务 程序 中 ， 机 器 控制 寄存 器 的 bit[15] 
位 被 清除 后 ， 程 序 怎样 返回 ? ) 

b. 什么 指令 可 以 真正 终止 机 器 ? 

c. 当 机 器 重新 启动 时 ， 第 一 条 被 执行 的 指令 是 什么 ? 

d. 在 HALT 服 务 程序 中 ，RET 指 令 的 返回 点 是 哪里 ? 

阅读 下 面 这 段 LC-3 汇 编 语言 程序 ， 并 回答 问题 : 


.ORIG X3000 


L1 LEA R1, L1 
AND R2, R2, x0 
ADD R2, R2, x2 
LD R3, P1 

L2 LDR RO, R1, xC 
OUT 
ADD R3, R3, #-1 
BRz GLUE 
ADD R1, R1, R2 
BR L2 

GLUE HALT 

Pl C .FI B 


. LL 
.STRINGZ ."HBoeoakteSmtHaotren!s"^ 


. END 
a. 这 个 程序 经 过 汇编 并 加 载 到 内 存 后 ， 在 地 址 x3005 处 的 二 进 制 内 容 是 什么 ? 


b. x3005 处 的 指令 执行 之 后 ， 下 一 条 执行 指令 是 什么 〈 给 出 内 存 地 址 ) ? 


c. X3006 处 的 指令 执行 之 前 ， 执 行 的 是 哪 一 条 指令 (给 出 内 存 地 址 ) ? 


d. 这 个 程序 的 输出 是 什么 ? 
下 面 这 个 LC-3 程 序 ， 在 汇编 之 后 被 执行 。 假 设 忽 略 汇编 时 间 和 运行 时 错误 ， 该 程序 的 输出 是 
什么 ? 其 中 ,假定 在 程序 执行 之 前 ， 所 有 寄存 器 的 内 容 都 为 0。 


.ORIG x3000 


STR RO, x3007 
LEA RO, LABEL 
TRAP x22 


TRAP x25 
LABEL .STRINGZ "FUNKY" 
LABEL2  .STRINGZ "HELLO WORLD" 
. END 


fnj9-189 1E aT E, LC TE GE EIU A, RUSUCKCS EBERT, (BAR, WRAAE "S", £i 
果 如 何 ? 更 好 的 程序 处 理应 该 是 ， 检 查 输 入 字符 是 否 是 “大 写字 母 "， 如 果 不 是 ， 则 执行 纠 错 
操作 。 请 修改 例 9-1 所 示 代 码 ， 添 加 输入 检查 代码 。 即 编写 程序 ， 如 果 输 入 为 大 写字 母 ， 则 输 
出 对 应 的 小 写字 母 ， 如 果 输 入 是 其 他 字符 ， 则 终止 执行 。 

假设 两 个 学 生 分 别 写 了 两 个 中 断 服务 程序 ， 且 两 个 服务 程序 所 做 的 工作 是 相同 的 。 如 果 第 一 
个 学 生 的 程序 结尾 没有 使 用 RET 指 令 ， 而 第 二 个 学 生 正 确 使 用 了 RET 指 令 。 那 么 ， 第 一 个 学 
生 的 程序 中 将 出 现 三 个 错误 。 请 列举 其 中 的 任意 两 个 错误 。 

假设 ， 在 下 面 这 个 程序 执行 前 ， 内 存 地 址 A 处 原 有 的 数据 值 介 于 2~32768 之 间 。 试 描述 该 程序 
的 执行 结果 (简要 描述 ， 不 超过 20 个 字 )。 
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.ORIG x3000 
AND R4, R4, #0 
LD RO, A 
NOT R5, RO 
ADD R5, R5, #2 
ADD R1, R4, #2 


REMOD JSR MOD 
BRz STOREO 


; 

ADD R7, Ri, R5 
BRz STORE1 
ADD R1, R1, #1 
BR REMOD 


H 
STOREl ADD R4, RA, #1 


STOREO ST R4, RESULT 
TRAP x25 
MOD ADD R2, RO, #0 


DEC ADD R2, R2, R3 
BRp DEC 
RET 
A  BLEN i 
RESULT .BLKW 1 
. END 
回顾 之 前 的 “机 器 忙 ”例子 。 假 设 表 示 机 器 忙 或 空间 的 二 进 制 字 所 在 内 存 地 址 为 x4001。 请 分 
别 编写 完成 以 下 任务 的 子 程序 。 


a. 检查 是 否 所 有 机 器 都 “空间 ”， 如 果 是 则 返回 1， 
b. 检查 是 否 所 有 机 器 都 “忙碌 ”， 如 果 是 则 返回 1， 
c. 检查 有 多 少 台 机 器 是 忙碌 的 ， 返 回 忙 碌 机 器 的 数量 
d. 检查 有 多 少 台 机 器 是 空 亲 的， 返回 空 闲 机 器 的 数量 ; 
e. 检查 R5 内 容 指定 的 机 器 是 否 忙碌 ， 如 果 是 则 返回 1， 
f. 返回 任意 一 台 “ 空 ”机 器 的 编号 。 
trap 服 务 程 序 的 起 始 地 址 ， 保 存在 TRAP 指 令 所 指定 的 内 存 位 置 中 。 试 问 ， 为 什么 不 直接 在 
TRAP 指 令 中 指定 trap 服 务 程序 的 起 始 地 址 ? (假设 每 个 trap 服 务 程序 最 多 包含 16 条 指令 .) 
试 修改 LC-3 TRAP 指 令 的 语义 ， 使 陷 人 舌 量 直接 提供 服务 程序 的 起 始 地 址 。 
如 下 是 一 个 待 编译 (或 汇编 ) 的 LC-3 程 序 。 该 程序 的 任务 是 ， 从 控制 台 读 入 包含 若干 行 的 文 
本 输入 ， 并 存 人 缓存 中 以 供 字符 查找 ， 最 后 输出 该 字符 在 文本 中 出 现 的 次 数 。 假 设 文本 的 结 
束 符 为 BOT， 且 文本 长 度 不 超过 1000 个 字符 。 在 输入 整个 文本 后 ， 程 序 读 取 待 统计 的 字符 。 
其 中 ， 标 识 为 COUNT 的 子 程序 ( 即 计数 程序 ) 由 另 一 个 人 编写 ， 且 其 所 在 地 址 为 x3500。 当 
该 子 程序 被 调用 时 ， 它 默认 R5 的 内 容 为 缓存 (buffer) 地 址 ，R6 的 内 容 为 被 统计 字符 。 在 缓 
存 中 ， 规 定 以 NULL 标 记 文 本 的 结尾 。 最 后 ， 该 子 程序 将 计数 结果 存 人 R6。 
子 程序 DUTPUT 的 作用 是 ， 将 计数 结果 从 二 进 制 形式 转换 为 ASCI 字 符 (数字 )， 并 输出 显示 。 
该 子 程序 也 由 另 一 个 人 编写 ， 所 在 地 址 为 x3600。 它 默认 R6 的 内 容 是 被 打印 的 字符 (数字 )。 
如 下 所 示 是 读 取 输 入 和 调用 COUNT 的 代码 : 
.ORIG x3000 
LEA R1, BUFFER 
G TEXT TRAP x20 
ADD R2, RO, x-4 
BRz G CHAR 
STR RO, R1, #0 
ADD Ri, R1, #1 
BRz G TEXT 
G CHAR STR R2, R1, #0 ; X0000 terminates buffer 


TRAP x20 1 Get character to count 
ST RO, S CHAR 


; Get input text 


£9* 
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LEA R5, BUFFER 
LEA R6, S CHAR 
LD R4, CADDR 
JSRR R4 ; Count character 
LD R4. OADDR 
JSRR R4 ; Convert R6 and display 
TRAP x25 

CADDR .FILL x3500 ; Address of COUNT 

OADDR .FILL x3600 ; Address of OUTPUT 


9.12 


9.14 


BUFFER .BLKW 1001 
S CHAR .FILL x0000 


但 是 ， 在 该 代码 中 存在 问题 。 请 找 出 问题 ， 并 给 出 修正 方案 (提示 ， 问 题 不 出 在 子 程序 
COUNT 和 OUTPUT 中 )。 


阅读 下 面 这 个 LC-3 汇 编 语言 程序 ， 然 后 回答 问题 ， 
.ORIG x3000 
LEA RO,DATA 
AND Ri1,R1,#0 
ADD R1,R1,H9 

LOOP1 ADD R2,R0O, #0 
ADD R3,R1, #0 

LOOP2 JSR SUB1 
ADD R4,R4,#0 
BRzp LABEL 
JSR SUB2 

LABEL ADD R2,R2,81 
ADD R3,R3,8-1 
BRP LOOP2 
ADD R1,R1,#-1 
BRp LOOP1 
HALT 

DATA .BLKW 10 x0000 

SUB1 LDR R5,R2,#0 
NOT R5, R5 
ADD R5,R5,#1 
LDR R6, R2, #1 
ADD R4, R5,R6 
RET 

SUB2 LDR R4,R2, #0 
LDR R5,R2,#1 
STR R4,R2, #1 
STR R5,R2,#0 
RET 
. END 


假设 ， 内 存 地 址 DATA 的 内 容 在 程序 执行 之 前 就 已 填充 好 。 试 问 ， 在 程序 执行 之 前 和 之 


后 ，DAIA 的 前 后 内 容 之 间 是 否 存 在 联系 ? 
如 下 所 示 程 序 的 任务 是 ， 在 屏幕 上 打印 数字 $。 但 它 无 法 正常 工作 ， 试 问 为 什么 (简要 回答 ， 


不 多 于 10 个 字 ) ? 

.ORIG — x3000 
JSR A 
OUT 
BRnzp DONE 

A AND RO, RO,#D 
ADD RO, RO, #5 
JSR B 
RET 

DONE HALT 

ASCII „FILL x0030 

B LD R1,ASCII 
ADD RO,RO,R1 
RET 
.END 


— g~ 


如 图 9-6 所 示 ， 服 务 程序 通过 请 除 RUNT 〈 即 机 器 控制 寄存 器 的 bit[15]) 来 终止 计算 机 运行 
(第 14 行 )。 试 问 ， 第 19~1C 行 指令 的 作用 是 什么 ? 

假设 我 们 在 内 存 地 址 x4000 处 又 定义 了 一 个 新 的 服务 程序 。 该 程序 的 任务 是 ， 读 人 一 个 字符 ， 
然后 将 它 显 示 在 屏幕 上 。 假 设 内 存 地 址 x0072 中 包含 数值 x4000， 且 服务 程序 如 下 所 示 ， 试 
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回答 问题 ， 
.ORIG x4000 
ST R7, SaveR?7 
GETC 
OUT 
LD R?, SaveR?7 
RET 


SaveR7  .FILL x0000 

a. 给 出 调用 这 个 程序 的 指令 ， 

b. 该 服务 程序 能 否 正 常 工作 ? 请 给 出 理由 。 

我 们 将 下 面 a 和 b 两 段 代码 分 别 汇编 。 但 在 编译 (或 链接 ) 时 ， 出 现 两 个 错误 ， 请 找 出 问题 并 
盖 述 原因 ， 说 明 错误 是 在 编译 阶段 还 是 在 汇编 阶段 被 检查 到 的 。 


a. 
.ORIG x3200 
SORT ADD RO, RO, #0 
; code to perform square 
; root function and 
; return the result in RO 
RET 
. END 
b. 
.EXTERNAL SQRT 
.ORIG x3000 
LD RÔ, VALUE 
JSR SQRT 
ST RO, DEST 
HALT 
VALUE .FILL x30000 
DEST .FILL x0025 
.END 


如 下 所 示 程 序 的 任务 是 ， 询 问 他 /她 的 名 字 ， 然 后 输出 字符 串 “Hello, 名 字 ”。 该 字符 串 所 在 
位 置 是 标识 为 HELLO 的 内 存 位 置 。 程 序 假设 用 户 在 输入 他 /她 的 名 字 之 后 ， 按 回 车 键 
(ASCII 码 = x0A)， 且 名 字 长 度 不 超过 25 个 字符 。 

例如 ， 用 户 在 看 到 提示 后 ， 输 入 名 字 “Onur”， 随 后 敲 入 一 个 回 车 键 ， 则 程序 输出 如 下 所 示 ; 


Please enter your name: Onur 
Hello, Onur 


WE (a) ~ (d) 处 填 人 合适 的 指令 ， 完 成 该 程序 。 
.ORIG x3000 
LEA R1,HELLO 
AGAIN LDR R2,R1,40 
BRz NEXT 
ADD R1,R1,81 
BR AGAIN 
NEXT LEA RO, PROMPT 
TRAP x22 ; PUTS 


AGAIN2 TRAP x20 ; GETC 
; OUT 


CONT AND R2,R2, #0 


TRAP x22 ; PUTS 

TRAP x25 ; HALT 
NEGENTER .FILL xFFF6 ; -XOA 
PROMPT .STRINGZ "Please enter your name: 
HELLO .STRINGZ "Hello, " 

.BLKW $25 

.END 


如 下 所 示 程 序 ， 执 行 完 成 之 后 的 输出 内 容 为 : 


ABCFGH 
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试 在 (a) ~ (d) 之 间 插 人 合适 的 指令 ， 完 成 该 程序 。 
,ORIG x3000 
LEA Rl, TESTOUT 

BACK 1 LDR RO, R1, #0 


BRnzp BACK 1 


i 
NEXT_1 "LEA R1, TESTOUT 


ADD R1, R1, #1 


NEXT_2 — ------------ (b) 

SUB 1  ------------ (c) 

K LDI R2, DSR 
~- (d) 
STI RO, DDR 
RET 

DSR .FILL xFE04 

DDR .FILL xFEO6 


TESTOUT -STRINGZ "ABC" 
.END 

9.19. 假设 一 家 公司 计划 制造 一 台 真 正 的 LC-3 计 算 机 。 为 了 让 该 计算 机 能 工作 在 网 络 环境 中 ， 我 
们 为 它 安装 4 个 中 断 驱动 类 型 的 IO 设备 链接 。 如 果 接 收 到 服务 请 求 ， 其 中 一 个 设备 就 会 向 系 
统 发 出 独立 的 中 断 请 求 信号 〈 了 RQ) ， 结 果 是 LC-3 的 中 断 控 制 寄 存 器 INTCTL 中 的 某 个 bit 将 
被 置 位 (INTCTL 的 内 存 映射 地 址 为 xFF00)。INTCTL 寄 存 器 的 字段 组 成 如 下 所 示 。 当 某 个 
设备 请 求 服务 时 ，LC-3 数 据 通路 产生 INT 信 和 号， 中断 服务 程序 将 判断 是 哪个 设备 发 出 的 服务 
请 求 ， 然 后 调用 相应 的 设备 服务 子 程序 处 理 该 请 求 。 如 果 是 多 个 设备 同时 发 出 IRQ 信 和 号 ， 则 
只 有 优先 级 最 高 的 设备 先 被 处 理 。 在 子 程序 执行 过 程 中 ， 相 应 的 INTCTL 位 将 被 清 掉 。 





INT 
如 下 所 示 是 4 个 设备 处 理子 程序 起 始 地 址 的 标识 各 
HARDDISK ETHERNET PRINTER CDROM 
例如 ， 优 先 级 最 高 的 设备 “打印 机 ”请 求 服务 ， 则 中 断 服务 程序 将 通过 如 下 指令 调用 打 
印 机 处 理子 程序 ， 


JSR PRINTER 
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按照 优先 级 规则 ， 请 填写 标号 为 (a) ~ (k) 处 的 指令 ， 完 成 整个 LC-3 中 断 服务 程序 。 
优先 级 顺序 如 下 所 示 (其 中 ， 数 值 越 低 ， 代 表 的 设备 优先 级 越 高 )。 

(1) Hard disk; 

(2) Ethernet card; 

(3) Printer; 


(4) CD-ROM, 
LDI R1, INTCTL 
DEVO LD R2, ------ (a) 
AND R2, R2, R1 
BRnz DEV1 
JSR | ---------- (b) 
T0009 (c) 
DEV1 LD R2, ------ (d) 
AND R2, R2, R1 
BRnz  DEV2 
JSR | ---------- (e) 
T (f) 
; 
DEV2 LD R2, ------ (g) 
AND R2, R2, R1 
BRnz  DEV3 
JSR | ---------- (h) 
T0 (i) 
DEV3 JSR ----------- G) 
END | c (k) 
iINTCTL -FILL xFF00 
MASKS .FILL x0008 
MASK4 FILL x0004 


第 10 章 $k 


到 目前 为 止 ， 我 们 终于 完成 了 LC-3 指 令 集结 构 的 内 容 。 从 下 一 章 (第 11 章 ) 开始 ， 我 们 将 学 
习 更 高 层次 的 抽象 一 -C 语 言 编程 。 但 在 本 章 中 ,我 们 仍 将 花 一 些 时 间 ， 介 绍 一 个 非常 重要 的 话题 : 
A (stack)。 首 先 介绍 栈 的 基本 结构 ， 然 后 介绍 栈 的 三 种 用 途 : (1) 中 断 驱动 VO (参见 8.5 节 ) ， 
(2) 一 种 算术 运算 机 制 (通过 用 栈 替代 寄存 器 ,实现 计 算 中 间 结 果 的 临时 存储 ) ，(3) 二 进 制 补 
码 与 ASCII 字 符 串 之 间 的 转换 算法 。 在 这 三 个 例子 中 ， 我 们 只 展示 了 栈 的 “ 冰 出 一 角 ”(tip of the 
iceberg)。 事 实 上 ， 栈 在 计算 机 科学 与 工程 中 占据 着 非常 重要 的 地 位 。 我 们 相信 ， 将 来 你 必定 会 发 
现 更 多 的 栈 的 新 有 用法。 届时， 不 知 本 书 对 栈 的 介绍 是 否 能 给 你 带 来 美好 回忆 。 

有 关 指 令 集结 构 (ISA) 层 的 介绍 ， 最 后 的 一 个 例子 是 “计算 器 设计 "。 这 是 一 个 复杂 的 应 用 ， 
它 将 涉及 本 章 的 很 多 知识 。 


10.1 栈 的 基本 结构 
10.1.1 抽象 数据 类 型 : d 


在 今后 的 计算 机 使 用 或 设计 中 ， 你 必然 会 接触 到 一 种 被 称 为 “ 栈 ”(stack) 的 存储 机 制 。 栈 机 
制 的 实现 方法 有 多 种 。 但 是 ， 我 们 首先 要 介绍 的 是 栈 的 概念 〈 而 不 是 它 的 实现 ) 。 所 谓 “ 栈 ” 的 概 
念 ， 是 指 它 的 访问 规则 。“ 栈 ”的 定义 是 : 最 后 存 人 的 东西 ， 总 是 第 一 个 被 取 走 的 。 这 是 栈 与 其 他 
结构 相 区 别 的 主要 特点 。 我 们 称 这 种 特点 为 “后 入 先 出 ”或 “LIFO (Last In First Out)", 

按照 计算 机 的 术语 来 说 ， 我 们 称 栈 是 一 种 抽象 数据 类 型 (Abstract Data Type, ADT) 。 换 句 话 
说 ， 抽 象 数据 类 型 是 指 其 存储 机 制 的 操作 方式 〈 而 不 是 实现 方法 )。 例 如 ， 第 19 章 中 将 要 介绍 的 链 
表 (linked list) ， 也 是 一 种 抽象 数据 类 型 。 


10.1.2 两 个 实现 例子 


例如 ， 汽 车 扶手 边 上 的 硬币 盒 (coin holder) 就 是 “ 栈 ” 的 一 个 例子 。 第 一 个 被 取出 的 硬币 ， 
必然 是 最 后 放 入 的 硬币 。 而 你 放 入 硬币 时 ， 将 把 先前 的 硬币 又 向 硬币 盒 内 部 压 入 了 一 层 。 

如 图 10-1 所 示 ， 是 硬币 盒 的 使 用 示例 行为 。 最 开始 的 情况 如 图 10-1a 所 示 ， 硬 币 盒 是 空 的 。 假 
设 路 过 第 一 个 收费 站 的 时 候 ， 应 缴费 用 是 75 美 分 。 你 交 给 收费 员 1 美 元 ， 找 回 25 美 分 (1995 年 的 )， 
然后 你 将 它 塞 人 硬币 盒 。 此 时 ， 硬 币 盒 的 情况 将 如 图 10-1b 所 示 。 


ss pe 
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DARE RE) ”b) 压 入 一 次 之 后 0) 压 入 三 次 之 后 d) 弹 出 两 次 之 后 . 
图 10-1 一 个 栈 的 例子 -一 汽车 上 的 硬币 存放 器 
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有 关 “ 栈 ”的 插入 和 删除 操作 ， 我 们 有 特定 的 术语 。 插 入 一 个 元 素 时 ， 我 们 称 之 为 “ 压 人 ” 
(push) ， 删除 一 个 元 素 时 ， 我 们 称 之 为 “弹出 ”(pop)。 

随后 ,第 二 段 高 速 公路 费 是 4.25 美 元 ， 你 交 给 收费 员 5 美 元 ， 找 回 75 美 分 。 你 又 将 这 3 枚 25 美 
分 塞 人 硬币 盒 : 先是 1982 年 的 25 美 分 硬币 ， 然 后 是 1998 的 ， 最 后 是 1996 的 。 现 在 ， 硬 币 盒 的 情况 
将 如 图 10-1c 所 示 。 在 经 过 第 三 段 高 速 公路 收费 站 时 ， 费 用 是 50 美 分 ， 所 以 你 从 硬币 盒 中 取出 两 枚 
25 美 分 ， 它 们 一 个 是 1996 年 的 ， 另 一 个 是 1998 年 的 。 之 后 ， 硬 币 盒 的 情况 将 如 图 10-1d 所 示 。 

我 们 说 硬币 盒 是 一 个 “ 栈 ”， 更 确切 地 说 ， 它 符合 LIFO 规 则 。 新 放 人 的 硬币 ， 总 是 在 最 上 面 ， 每 
取 走 一 个 硬币 ， 也 总 是 最 上 面 的 。 最 后 放 人 的 硬币 ， 总 是 第 一 个 被 取 走 的 ， 所 以 我 们 说 它 是 一 个 栈 。 

图 10-2 是 又 一 个 栈 实现 的 例子 ， 我 们 称 之 为 “硬件 栈 ”(hardware stack)。 它 的 行为 与 之 前 的 
硬币 僵 很 相似 。 它 由 一 组 寄存 器 组 成 ， 每 个 寄存 器 可 以 存放 一 个 元 素 (element), 。 如 图 10-2 所 示 的 
例子 中 ， 包 含有 5 个 寄存 器 。 每 当 一 个 元 素 被 存 人 或 移出 时 ， 栈 中 其 他 元 素 都 将 一 起 移动 。 


空 标志 空 标志 空 标志 空 标志 
[L3 


amd 7^ ”b) 压 人 一 次 之 后 c) 压 人 三 次 之 后 d) 弹 出 两 次 之 后 
图 10-2 一 个 硬件 实现 的 栈 一 -数据 条 目 需 要 移动 


如 图 10-2a 所 示 ， 初 始 的 栈 是 空 的 。 栈 的 访问 总 是 针对 第 一 个 元 素 的 ， 我 们 将 该 寄存 器 标识 为 
TOP。 例 如 ， 数 值 18 被 压 入 栈 ， 则 结果 如 图 10-2b 所 示 。 随 后 ， 依 次 压 入 数值 31、5 和 12， 则 结果 如 
图 10-2c 所 示 。 再 如 ， 从 栈 中 弹出 两 个 元 素 ， 则 结果 如 图 10-2d 所 示 。 图 10-2 所 示 的 硬件 栈 ， 与 硬币 
收集 器 一 样 ， 有 一 个 共同 的 特点 : 每 压 和 人 或 弹出 一 个 栈 元 素 ， 栈 中 所 有 元 素 都 将 一 起 “移动 "。 


10.1.3 内 存 中 的 实现 


在 各 种 计算 机 系统 中 ， 最 常见 的 栈 实 现 方式 如 图 10-3 所 示 ， 它 是 由 一 段 连 续 内 存 空 间 和 一 个 
寄存 器 ( 栈 指 针 ) H. MR “RH” (stack pointer)， 是 一 个 寄存 器 ， 它 的 内 容 是 一 个 地 址 值 ， 
始终 指向 栈 的 顶部 ( 即 最 近 被 压 人 的 元 素 )。 每 个 被 压 人 栈 中 的 元 素 ， 在 内 存 空 间 中 都 占据 着 一 个 
独立 的 位 置 。 但 是 ， 在 人 栈 和 出 栈 操作 时 ， 栈 中 的 其 他 数据 不 需要 再 被 移动 。 
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x3FFC| ll x3FFC| 7771/ 
x3FFD | ////// x3FFD| 1717/ 
x3FFE| 1717/ x3FFE| JAIN 
x3FFF| ZI x3FFF | 18 | 





m 


a) 初 始 状态 b) 压 人 一 次 之 后 c) 压 人 三 次 之 后 由) 弹出 两 次 之 后 
图 10-3 一 个 在 内 存 里 实现 的 栈 一 一 数据 条 目 不 需 要 移动 
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图 10-3 所 示 是 该 栈 的 组 成 结构 。 其 内 存 占用 范围 (大 小 为 5) Æ: x3FFF-x3FFB, ， 寄 存 器 R6 是 
栈 指针 。 

其 中 ， 图 10-3a 代 表 最 初 的 空 栈 ， 图 10-3b 是 压 人 值 18 后 的 情况 ， 随 后 ， 如 图 10-3c 所 示 ， 是 乔 
序 压 入 数值 31、5 和 12 之 后 的 情况 ， 最 后 ， 如 图 10-3d 所 示 ， 是 从 栈 顶 弹出 两 个 元 素 后 的 情况 。 注 
意 ， 两 个 元 素 ( 值 5 和 12) 即使 已 被 弹出 ， 其 内 容 仍然 存留 在 内 存 位 置 x3FFD 和 x3FFC。 但 是 ， 数 
值 5 和 12 已 不 能 再 被 访问 ， 这 是 因为 该 段 内 存 只 能 通过 楼 机 制 来 访问 。 

1. ÆA , 

如 图 10-3a 所 示 ，R6 的 内 容 是 x4000， 即 第 一 个 栈 位 置 (基地 址 ) 之 前 的 一 个 位 置 。 它 表明 此 
时 的 栈 是 空 的 。 图 10-3 所 示 的 栈 ， 基 地 址 (BASE) 等 于 x3FFF。 

首先 ， 我们 压 人 (PUSH) 数值 18 ， 结 果 如 图 10-3b 所 示 。 栈 指针 指向 的 是 最 后 压 人 的 值 ， 即 
x3FFF (存储 18 的 位 置 )。 注 意 ， 地 址 x3FFE、x3FFD、x3FFC 和 x3FFB 的 内 容 没 有 显示 出 来 。 我 们 
很 快 会 明白 ， 它 们 的 内 容 其 实 是 无 关 的 。 因 为 我 们 并 不 能 通过 x3FFF~x3FFB 的 地 址 直接 访问 它们 ， 
只 能 通过 栈 方式 来 访问 。 

我 们 看 到 ， 每 压 和 人 一 个 值 到 栈 中 ， 楼 指针 先 递减 ， 然 后 将 数值 在 人 它 的 地 址 位 置 。 如 下 面 两 
条 指令 序列 所 示 : 


PUSH ADD R6,R6,#-1 
STR RO,R6,#0 


其 中 ， 这 两 条 指令 的 任务 是 将 R0 的 内 容 压 人 栈 。 所 以 ， 如 果 如 图 10-3b 所 示 ， 在 这 两 条 指令 执 
行 之 前 ，R0 的 内 容 应 该 已 经 为 数值 18。 

随后 ， 我 们 将 31、5 和 12 等 三 个 数值 依次 装 人 R0， 并 调用 这 两 条 指令 序列 ， 将 它们 压 人 栈 中 。 
如 图 10-3c 所 示 ，R6 〈 栈 指针 ) 的 值 为 x-3FFC， 这 意味 着 数值 12 是 最 后 一 个 被 压 人 栈 的 元 素 。 

2. 弹出 

如 果 想 从 栈 里 弹出 (POP) 一 个 元 素 ， 要 先 通过 栈 指针 提供 的 地 址 读 取 访 数值， 然后 递增 栈 


指针 。 如 下 面 两 条 指令 序列 所 示 ， 


POP LDR RO,R6,30 
ADD R6,R6,31 


其 中 ， 栈 顶 元 素 的 值 被 弹出 ， 并 装 人 R0。 

如 图 10-3c 所 示 ， 在 两 次 执行 以 上 指令 序列 之 后 ， 将 有 两 个 数值 被 弹出 栈 。 先 是 12， 然 后 是 5。 
假设 我 们 弹出 两 个 值 的 目的 是 为 了 使 用 它们 ， 则 在 第 二 次 POP 调用 前 ，R0 原 先 的 内 容 12 应 拷贝 到 
别 的 地 方 。 

图 10-3d 所 示 是 上 述 操作 执行 之 后 栈 的 情况 。 其 中 ，R6 的 内 容 是 x3FFE (代表 当前 栈 顶 元 素 是 
31)。 注 意 ， 内 存 地 址 x3FFD 和 x3FFC 的 内 容 仍然 是 12 和 5。 但 是 ， 由 于 对 楼 空间 操作 时 ， 只 能 通过 
PUSH 压 人 、POP 弹 出 。 所 以 ， 对 这 个 空间 的 操作 ， 只 要 严格 遵循 读 规 则 ， 一 切 都 会 正常 。 我 们 将 
XSARA “RAR” (stack protocol), 

3. 下 溢出 

试问 ， 如 果 我 们 现在 尝试 从 栈 中 弹出 三 个 数值 ， 结 果 会 如 何 ? 由 于 此 时 栈 内 只 有 两 个 元 素 ， 所 以 
问题 出 现 了 。 试 图 对 一 个 空 栈 执行 弹出 操作 ， 将 造成 “下 溢 ” (underflow) 问题 。 在 下 面 的 例子 中 ， 
我 们 将 通过 地 址 值 x4000 与 栈 指针 内 容 之 间 的 比较 ， 检 查 是 否 发 生 “ 下 溢 ” 现 象 。 其 中 ，x4000 是 栈 为 
空 时 ，R6 的 值 ， 标 识 UNDERFLOW 代 表 下 溢 处 理 程序 的 起 始 地 址 。 修 订 后 的 POP 指令 序列 如 下 所 示 ， 


POP LD R1,EMPTY 


ADD R2,R6,R1 ; Compare stack 
BRz UNDERFLOW ; pointer with x4000. 
LDR RO,R6,#0 
ADD R6,R6,#1 
RET 
EMPTY .FILL XC000 ; EMPTY «-- -x4000 
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但 是 ， 与 其 让 程序 控制 流 在 POP 不 成 功 时 ， 跳 转 至 UNDERFLOW 程 序 ， 不 如 让 它 返 回 到 调用 
程序 (并 将 “下 溢 ” 信 息 记 录 在 某 个 寄存 器 中 ) 。 

常用 的 做 法 是 ， 子 程序 将 执行 成 功 或 失败 的 信 
息 记 录 在 某 个 寄存 器 中 。 如 图 10-4 所 示 ， 在 POP 程 
序 的 流程 中 ， 将 成 功 或 失败 的 信息 记录 在 R5 中 。 

那么 ，POP 程 序 返 回 后 ， 调 用 程序 通过 R5 就 可 
以 获知 POP 执行 是 否 成 功 (如 果 成 功 , R5=0; 否则， 
R5-1), 

注意 ， 由 于 POP 程序 将 使 用 R5 记 录 执 行 状况 。 
所 以 ，R5 的 原 内 容 (POP 执行 之 前 ) 将 丢失 。 因 此 ， 
这 就 要 求 调用 程序 在 JSR 指 令 执 行 之 前 ， 保 存 R5 的 
内 容 。 参 考 9.1.7 节 中 的 调用 者 保存 方式 。 

再 次 修改 之 后 ，POP 程 序 如 下 所 示 。 注 意 ， 
RET 指 令 之 前 的 那 条 指令 能 影响 “条 件 码 ”， 所 以 图 10-4 BST “TR” 检查 的 POP 程序 
调用 程序 也 可 进行 条 件 位 Z 的 测试 ， 判 断 POP 程 序 





的 执行 是 否 成 功 。 

POP LD R1,EMPTY 
ADD R2,R6,R1 
BRz Failure 
LDR RO,R6,40 
ADD R6,R6,H1 
AND R5,R5,40 
RET 

Failure AND R5,R5, #0 
ADD R5,R5,#1 
RET 

EMPTY .FILL xCO00 ; EMPTY «-- -x4000 

4. Ei dh 


试问 ， 如 果 在 栈 空 间 已 被 全 部 占用 的 情况 下 ， 再 往 栈 中 压 人 元 素 ， 结 果 会 如 何 ? 由 于 已 经 没有 
PARRER, MARIER “LA” (overflow) 的 问题 。 当 然 ， 通 过 比较 栈 指针 内 容 与 
数值 x3FFB (如 图 10-3 所 示 )， 可 以 判断 是 否 发 生 “ 上 溢 ”"。 如 果 两 个 值 相等 ， 则 意味 着 栈 空间 已 无 法 
再 存储 元 素 了 。 假 设 OVERFLOW 是 “上 溢 ” 处 理 程序 的 起 始 地 址 ， 则 修改 后 的 PUSH 程 序 如 下 所 示 : 


PUSH LD R1 ,MAX 


ADD R2,R6,R1 
BRz OVERFLOW 
ADD R6,R6,8-1 
STR RO,R6,&0 
RET 
MAX .FILL . xC005 ; MAX «-- -x3FFB 


同 POP 程 序 一 样 ， 如 果 我 们 能 够 记录 程序 执行 状态 ， 并 返回 调用 程序 再 处 理 ， 则 要 比 直接 跳 到 
OVERFLOW 子 程序 更 有 意义 。 

所 以 ， 我 们 要 求 PUSH 程序 在 执行 成 功 之 时 ， 将 数值 0 存 和 RS， 失败 之 时 则 将 1 存 人 R5。 于 是 ， 
PUSH 程序 返回 后 ， 调 用 程序 通过 检查 R5 的 内 容 ， 即 可 判断 PUSH 的 执行 是 否 成 功 (R5=0 表 示 成 功 ， 
R5=1 表 示 失 败 )。 

再 次 注意 ， 由 于 R5 被 用 于 存放 PUSH 程 序 的 执行 状态 (成功 或 失败 )。 所 以 ， 这 又 是 一 个 调用 
者 保存 的 例子 。 换 句 话 说， 为 避免 R5 在 PUSH 程序 执行 之 前 的 内 容 丢 失 ， 调 用 程序 要 在 JSR 指 令 执 
行 之 前 ， 保 存 R5 的 内 容 。 

同样 ， 因 为 RET 之 前 的 指令 设置 了 条 件 位 ， 所 以 调用 程序 也 可 以 通过 条 件 位 Z 或 P 来 判断 PUSH 
程序 的 执行 是 否 成 功 完 成 了 。PUSH 程 序 如 下 所 示 : 
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PUSH LD R1,MAX 
ADD R2,R6,R1 
BRz Failure 
ADD R6,R6,H-1 
STR RO, R6, #0 
AND R5,R5,40 
RET 

Failure AND R5,R5, #0 
ADD R5, R5, #1 
RET 

MAX .FILL XC005 ; MAX «-- -x3FFB 

10.1.4. 小 结 


通过 子 程序 POP 和 PUSH， 我 们 可 以 将 $ 个 内 存 位 置 x3FFF~x3EFB ， 设 计 为 一 个 栈 。 例 如 ， 如 
果 将 一 个 数值 于 人 栈 ， 只 需 将 该 数值 装 人 R0， 然 后 执行 “JSR PUSH” 即 可 ， 如 果 弹 出 栈 的 元 素 ， 
则 执行 JSR POP 即 可 (结果 在 RO 中 )。 如 果 希 望 改变 栈 的 空间 位 置 或 大 小 ， 只 需 调 整 代码 中 BASE 
和 MAX 的 值 。 

在 话题 结束 之 前 ， 我 们 还 需要 注意 一 些 细节 。 在 PUSH 和 POP 子 程序 中 ， 使 用 了 R1、R2 和 R5 
这 三 个 寄存 器 。 如 果 希 望 在 PUSH 或 POP 程序 返回 调用 程序 后 ， 还 能 够 继续 使 用 之 前 存在 它们 中 的 
数据 ， 则 需要 在 使 用 前 保存 它们 的 内 容 。 以 R1 和 R2 为 例 ， 我 们 可 以 在 PUSH 和 POP 子 程序 内 部 ， 在 
使 用 它们 之 前 保存 它们 ， 然 后 在 返回 调用 程序 之 前 恢复 它们 的 原 值 。 这 或 许 是 最 简单 的 做 法 ， 并 
且 这 样 一 来 ， 调 用 程序 就 不 需要 了 解 在 PUSH 和 POP 中 都 使 用 了 哪些 寄存 器 ， 即 9.1.7 节 介绍 的 “被 
调用 者 保存 ”方式 。 但 是 ， 对 于 R5 则 有 些 不 同 。 事 实 上 ， 调 用 程序 将 通过 R5 了 解 调用 执行 状态 
(成 功 或 失败 ) 。 所 以 ，R5 将 由 调用 程序 负责 保存 (如 果 在 子 程序 执行 后 还 将 继续 使 用 R5 原 值 ) ， 
即 “ 调 用 者 保存 ”方式 。 

最 终 版 的 PUSH 和 POP 代码 ， 如 图 10-5 所 示 。 


j 
; Subroutines for carrying out the PUSH and POP functions. This 
; program works with a stack consisting of memory locations x3FFF 
; (BASE) through x3FFB (MAX). R6 is the stack pointer. 


i 


POP R2,Save2 ; are needed by POP. 
R1,Savel 
R1,BASE ; BASE contains -x3FFF. 
R1,R1,#-1 ; R1 contains -x4000. 
R2,R6,R1 ; Compare stack pointer to x4000. 
fail exit ; Branch if stack is empty. 
RO,R6,#0 ; The actual "pop" 
R6, R6, #1 ; Adjust stack pointer. 
success exit 
R2,Save2 ; Save registers that 
R1,Savel ; are needed by PUSH. 
R1,MAX ; MAX contains -x3FFB 
R2,R6,R1 ; Compare stack pointer to -x3FFB. 
fail exit ; Branch if stack is full. 
; Adjust stack pointer. 
; The actual "push" 
; Restore original 
; register values. 
; R5 «-- 8uccess. 


Success exit 


fail exit ， ; Restore original 
; register values. 


; R5 «-- failure. 


; BASE contains -x3FFF. 





图 10-5 RHN 
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10.2 中 断 驱 动 JO (第 二 部 分 ) 


之 前 ， 我 们 在 8.1.4 节 介绍 了 中 断 驱 动 HO 的 第 一 部 分 内 容 。 我 们 已 知 ， 在 轮 询 方 式 下 ， 处 理 器 
将 花费 太 多 的 执行 周期 在 LDI 和 BR 指令 上 ， 直 到 Ready 位 被 置 位。 而 在 中 断 驱动 WO 方式 下 ， 处 理 
器 不 再 为 LDI 和 BR 指令 的 重复 执行 浪费 时 间 。 相 反 ， 它 可 以 将 省 出 的 时 间 用 于 其 他 工作 (如 执行 
其 他 程序 )， 直 到 WO 设备 通知 它 “ 已 准备 好 ”。 

中 断 驱 动 /O 包 括 两 个 部 分 : 

(1) 中 断 使 能 机 制 : 在 有 输入 数据 要 传递 或 准备 好 接收 输出 数据 的 情况 下 ，I/OC 设 备 具 备 向 处 
理 器 发 出 中 断 的 能 力 。 

(2) WO 数据 传输 的 管理 能 力 ( 即 中 断 处 理 程序 )。 

如 8.5 节 所 介绍 的 ， 所 谓 “ 中 断 处 理 器 的 使 能 机 制 ”， 就 是 发 出 INT 信 和 号 的 能 力 。 我 们 看 到 ， 通 
过 READY 和 中 断 使 能 位 的 组 合 ， 是 怎样 输出 中 断 请 求 信 号 的 。 我 们 也 看 到 ， 只 有 在 中 断 请 求 信号 
的 优先 级 高 于 当前 执行 程序 的 优先 级 的 情况 下 ，INT 信 号 才能 有 效 。 如 图 8-8 所 示 ， 我 们 已 经 看 到 
该 机 制 的 优点 〈 处 理 器 不 再 在 轮 询 操作 上 浪费 时 间 ) 。 但 在 8.5 节 中 ， 我 们 并 未 介绍 MO 数据 传输 的 
管理 程序 ， 这 是 因为 介绍 它 需 要 栈 的 背景 知识 。 现 在 ， 我 们 已 学 习 了 栈 的 知识 ， 可 以 继续 介绍 
“中 断 驱动 TO” 了 。 

如 图 8-6 所 示 ，IO 数 据 传输 的 管理 程序 包括 三 个 阶段 : 

(1) 中 断 服务 程序 的 启动 。 

(2) 中 断 服务 程序 的 执行 。 

(3) 中 断 服务 程序 的 返回 。 

下 面 将 依次 阐述 它们 。 


10.2.1 启动 和 执行 


回顾 8.5 节 及 图 8-8 的 介绍 ， 当 一 个 IO 设备 的 优先 级 高 于 当前 执行 程序 时 ， 它 在 发 出 INT 信 和 号 时 
将 启动 中 断 。 从 处 理 器 角度 来 看 ， 它 在 每 执行 完 一 条 指令 (周期 ) 之 后 ， 都 将 检查 是 否 存在 INT。 
如 果 没 有 ， 则 继续 下 一 条 指令 的 执行 ， 如 果 检 测 到 INT， 则 暂停 下 一 条 指令 的 读 取 。 

此 时 ,开始 中 断 执行 的 准备 工作 ， 以 启动 该 1/O 设 备 的 中 断 服务 程序 。 准 备 工作 包括 : (1) 保 
存 当前 执行 程序 的 状态 ， 以 使 得 中 断 处 理 程序 返回 时 ， 能 从 当前 的 程序 执行 ， (2) 装载 中 断 服务 
程序 的 工作 状态 ， 开 始 中 断 请 求 的 服务 。 

1. 程序 状态 

所 谓 “程序 状态 ”(state of a program)， 是 指 该 程序 运行 所 涉及 资源 的 快照 。 它 包括 该 程序 的 
内 存 空间 和 通用 寄存 器 的 内 容 ， 以 及 两 个 重要 的 寄存 器 ; PC 和 PSR 寄 存 器 。 有 关 PC 寄 存 器 ， 相 信 
你 已 经 很 热 悉 了 ， 它 包含 的 是 下 一 条 待 执行 指令 所 在 的 内 存 地 址 。PSR 寄 存 器， 顾名思义 是 “处 理 
器 状态 寄存 器 ”"， 它 包含 了 与 运行 程序 相关 的 重要 信息 。 下 面 是 PSR 的 各 字段 信息 : 


15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 
Ps 
Priv Priority condcodes 


其 中 ，PSR[15] 代 表 的 是 该 程序 的 运行 模式 ， 特 权 (超级 用 户 ) 模式 或 非特 权 (用 户 ) 模式 。 
所 谓 “ 特 权 模 式 ”， 是 指 在 该 模式 下 ， 程 序 能 够 访问 一 般 用 户 程序 不 可 访问 的 资源 。 我 们 将 看 到 该 
模式 对 中 断 处 理 的 重要 意义 ，PSR[10:8] 代 表 正 在 执行 程序 的 优先 级 别 (priority level) 。 前 面 已 经 
讲 到 ， 一 共有 8 种 特权 级 别 ，PL0 (最 低 ) ~PL7 (最 高 )。PSR[2:0] 代 表 条 件 码 ，PSR[2] =N, 
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PSR[1] = Z, PSR[0] = P, 

2. 被 中 断 程 序 的 状态 保存 

中 断 启动 的 第 一 个 任务 ， 就 是 保存 正在 运行 程序 的 状态 ， 以 使 得 MO 设备 请 求 的 服务 完成 后 ， 
程序 可 以 继续 运行 。 换 名 话说， 以 LC-3 为 例 ， 我 们 需要 保存 PC 和 PSR。 保 存 PC， 是 因为 通过 它 可 
以 获知 中 断 返 回 后 的 下 一 条 待 执行 指令 ， 保存 条 件 码 ， 是 因为 后 续 程序 可 能 将 依赖 它 完 成 条 件 跳 
$$, 保存 被 中 断 程序 的 优先 级 ， 是 因为 它 提供 被 中 断 程序 与 其 他 程序 相 比 的 迫切 程度 ， 被 中 断 程 
序 恢复 执行 时 ， 可 能 还 有 其 他 级 别 的 程序 试图 再 次 中 断 它 ， 最 后 要 保存 的 是 被 中 断 程序 的 特权 级 
别 ， 这 是 因为 它 表 明了 被 中 断 程 序 可 以 访问 的 资源 范围 。 

一 般 情 况 下 ， 我 们 认为 通用 寄存 器 的 内 容 是 没有 必要 保存 的 。 因 为 我 们 可 以 假定 中 断 服 务 程 
序 在 动用 它们 之 前 ， 会 自觉 保存 它们 的 内 容 ， 并 在 返回 被 中 断 程 序 之 前 恢复 原 值 。 

LC-3 将 这 些 要 保存 的 信息 保存 在 一 个 特殊 的 栈 空间 中 ， 我 们 称 之 为 “超级 用 户 栈 ” 
(supervisor stack) ， 该 栈 空间 仅 供 特权 模式 下 的 程序 使 用 。 事 实 上 ， 它 们 也 是 内 存 空 间 的 一 部 分 ， 
只 是 它 与 用 户 程序 的 用 户 栈 空 间 是 相互 隔离 的 。 所 有 程序 都 通过 R6 CREE) 访问 栈 空间 ， 超 级 
用 户 栈 也 不 例外 。 只 不 过 在 超级 用 户 模式 下 ，R6 指 向 超级 用 户 栈 空间 ， 在 用 户 模式 下 ，R6 指 向 用 
户 栈 空间 。 因 此 ， 在 未 使 用 情况 下 ， 内 部 寄存 器 Saved.SSP 和 Saved.USP 分 别 用 于 保存 丙 个 栈 指针 
的 内 容 。 例 如 ， 当 特权 模式 从 用 户 态 切换 到 超级 用 户 态 时 ， 原 先 的 R6 内 容 将 被 存 人 Saved.USP， 然 
后 将 Saved.SSP 的 内 容 装 入 R6。 

这 意味 着 在 中 断 服务 程序 开始 之 前 ，R6 已 装 入 超级 用 户 栈 指针 的 内 容 。 而 PC 寄存 器 和 被 中 断 
程序 的 PSR 寄 存 器 内 容 将 被 压 人 超级 用 户 栈 (而 不 是 用 户 栈 )。 

3. 中 断 服务 程序 的 状态 装 入 

在 被 中 断 程 序 的 状态 信息 已 被 安全 存 人 超级 用 户 栈 之 后 ， 下 一 步 的 任务 则 是 装 入 中 断 服 务 程 
序 的 PC 和 PSR 内 容 。 中 断 服 务 程序 与 第 9 章 里 介绍 的 TRAP 程 序 很 相似 。 它 们 的 代码 都 事先 存在 于 
特定 的 内 存 地 址 段 中 。 它 们 服务 的 都 是 中 断 请 求 。 

KERORA “Epy” (vectored interrupt) 的 工作 方式 。 在 TRAP 指 令 的 学 习 中 ， 你 
应 该 已 熟悉 TRAP 矢 量 的 概念 。 在 中 断 情况 下 ,I/O 设备 在 发 出 中 断 时 ， 将 向 处 理 器 传递 一 个 8-bit 
的 矢量 值 〈 以 及 中 断 请 求 信号 和 设备 优先 级 )。 在 多 个 设备 同时 请 求 中 断 处 理 的 情况 下 ， 优 先 级 最 
高 的 请 求 被 “选中 ”并 传递 给 处 理 器 。 我 们 称 之 为 INTV。 如 果 该 中 断 被 处 理 器 接收 ， 它 将 该 8-bit 
的 中 断 矢 量 (ONTV) 扩展 为 一 个 16-bit 的 地 址 ， 即 中 断 矢 量 表 中 的 某 个 表 项 地 址 。 回 顾 第 9 章 的 
TRAP 矢 量 表 ， 其 内 存 占用 地 址 是 x0000~x00FEF， 其 中 每 个 表 项 的 内 容 是 一 个 TRAP 服 务 程序 的 起 
始 地 址 。 类 似 地 ， 中 断 矢量 开 的 内 存 位 置 是 x0100~x01FF， 每 个 表 项 包含 的 是 一 个 中 断 服务 程序 的 
起 始 地址 。 处 理 器 将 扩展 后 中 断 矢 量 INTV 地 址 的 内 容 ( 即 矢量 表 项 的 内 容 ) 装 人 PC。 

PSR 寄 存 器 的 装 和 过程 如 下 : 由 于 在 中 断 服 务 程序 中 ， 还 没有 指令 普 执 行 过 ， 所 以 PSR[2:0] 的 
内 容 初始 化 为 0， 而 中 断 服 务 程序 是 在 特权 模式 下 运行 的 ， 所 以 PSR[15] 被 设置 为 0，PSR[10:8] 则 被 
设置 为 中 断 请 求 者 ( 即 设备 ) 的 优先 级 别 。 

至 此 ， 完 成 中 断 服务 的 启动 阶段 。 之 后 ， 可 以 运行 中 断 服务 程序 了 。 

4. 中 断 服务 

此 时 ，PC 包 含 的 是 中 断 服务 程序 的 起 始 地 址 ， 所 以 下 一 个 开始 执行 的 就 是 中 断 服务 程序 了 ， 
即 IO 设备 的 请 求 开 始 被 服务 了 。 

例如 ， 有 人 在 LC-3 的 键盘 上 按 下 某 个 键 ， 它 将 “中 断 ” 处 理 器 。 随 后 ， 由 键盘 中 断 矢 量 所 指 
示 的 处 理 程序 (又 称 “ 名 柄 ”(handler) ) 将 被 激活 (invoke)。 处 理 程序 的 任务 是 ， 将 键盘 数据 寄 


存 器 的 内 容 拷贝 到 内 存 的 某 个 位 置 。 
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10.2.2 ”中断 返回 
中 断 服 务 程序 的 最 后 ， 是 中 断 返 回 指 令 RTI。 当 处 理 器 遇 到 RTI 指 令 时 ， 意 味 着 IO 设备 的 请 求 


已 经 完成 。 

RTI 指 令 (操作 码 为 1000) 的 任务 是 ， 将 PSR 和 PC 的 内 容 弹出 超级 用 户 栈 ， 然 后 将 它们 填 人 处 
理 器 中 的 正确 位 置 。 现 在 ， 条 件 码 的 值 已 恢复 为 程序 被 中 断 前 的 内 容 ， 如 果 需 要 ， 后 续 的 BR 指令 
即 可 正确 执行 了 。 同 样 ，PSR[15] 和 PSR[10:8] 的 内 容 也 被 恢复 (特权 级 别 和 优先 级 别 ) ， PC 也 已 恢 
复 ， 指 向 中 断 前 的 下 一 条 待 执行 指令 。 

所 有 的 事情 看 起 来 都 跟 中 断 发 生前 没有 两 样 ， 对 程序 来 说 ， 仿 佛 什么 也 没 发 生 过 一 样 。 


10.2.3 HF: HERE 


最 后 ， 我 们 通过 一 个 例子 ， 结 束 有 关中 断 驱 动 IO 的 讨论 。 

假设 程序 4 止 在 执行 。 这 时 ，WO 设 备 B 突 然 请 求 服务 ， 且 8 的 优先 级 高 于 4， 中 断 开始 服务 。 而 
在 IO 设备 8 的 中 断 服务 程序 正在 执行 时 ， 设 备 C 又 产生 中 断 。 

图 10-6 所 示 是 所 发 生 情况 的 执行 流程 。 





x6200 ”设备 C 的 服务 程序 


x6300 


x6315 


| 图 10-6 中 断 驱动 1/O 的 执行 流程 图 
其 中 ， 程 序 4 位 于 内 存 地 址 x<3000~x3010， 在 执行 x<3006 的 ADD 指 令 时 ， 设备 8 发 出 了 中 断 请 求 


.信号 ， 导 致 矢量 xF1 的 INT 产 生 。 

设备 8 的 中 断 服 务 程序 位 于 x6200~x6210。x6210 处 是 RTI 指 令 。 当 有 的 中 断 服务 程序 执行 到 
x6202 的 AND 指 令 时 ， 设 备 C 又 发 出 中 断 请 求 (对 应 的 中 断 矢 量 是 xF2) 。 由 于 设备 C 的 优先 级 高 于 
设备 8， 所 以 INT 再 次 发 生 。 

设备 C 的 中 断 服务 程序 位 于 x6300~x6315。x6315 处 是 RTI 指 令 。 

让 我 们 看 一 下 处 理 器 的 执行 过 程 。 图 10-7 所 示 是 该 例子 在 执行 过 程 中 ， 超 级 用 户 栈 和 PC 的 内 


容 快照 。 
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图 10-7 中 断 驱动 /O 执 行 过 程 中 的 超级 用 户 栈 和 PC 的 内 容 快照 


其 中 ， 处 理 器 的 执行 顺序 如 下 所 示 : 

如 图 10-7a 所 示 ， 是 程序 4 在 读 取 x3006 的 指令 前 的 超级 用 户 栈 和 PC 状态 值 。 注 意 ， 图 中 标识 的 
栈 指针 是 Saved.SSP (而 不 是 R6)。 由 于 此 时 中 断 尚未 发 生 ， 所 以 R6 所 指向 的 仍然 是 用 户 栈 。 在 
x3006 指 令 执 行 的 最 后 ， 检 测 到 INT 信 号 (设备 8 的 中 断 )。 于 是 ， 程 序 4 的 状态 将 被 保存 在 超级 用 
户 栈 。 但 前 提 是 能 开始 使 用 超级 用 户 栈 ， 所 以 先 将 当前 R6 的 内 容 保存 人 Saved.USP 寄 存 器 ， 然 后 将 
Saved.SSP 的 内 容 装 人 R6， 随 后 ，PC 的 内 容 (程序 4 的 下 一 条 指令 地 址 ) x3007 被 压 人 超级 用 户 栈 。 
闻 样 ，ADD 指 令 产生 的 条 件 码 和 PSR 信 息 也 被 压 人 超级 用 户 栈 ， 再 随后 ， 设 备 8 的 中 断 矢 量 值 被 扩 
展 为 16-bit 的 x01F1，x01F1 的 内 容 (x6200) 则 被 装 入 PC。 图 10-7b 所 示 是 此 时 的 超级 用 户 栈 和 PC 
寄存 器 状态 。 

设备 8 的 中 断 服务 程序 开始 执行 。 在 x6202 指 令 执 行 周期 结束 时 ， 又 检测 到 一 个 更 高 优先 级 的 
中 断 。 随 后 ， 地 址 x6203 被 压 人 超级 用 户 栈 中 ， 同 时 压 人 的 还 有 8 程序 的 PSR 内 容 (包含 AND 指 令 
产生 的 条 件 码 信息 ) ， 设 备 C 的 中 断 矢 量 被 扩展 为 16-bit 的 x01F2，x01F2 的 内 容 (x6300) 被 装 人 
PC。 图 10-7c 所 示 是 此 时 的 超级 用 户 栈 和 PC 寄存 器 状态 。 

程序 C 在 执行 X6315 的 RTI 指 令 之 后 ， 超 级 用 户 栈 被 两 次 弹出 。 一 是 恢复 8 程序 的 PSR 内 容 (其 
中 包含 x6202 的 AND 指 令 所 产生 的 条 件 码 ) ， 二 是 恢复 PC 寄存 器 的 内 容 (x6203)。 图 10-7d 所 示 是 
此 时 的 超级 用 户 栈 和 PC 寄存 器 状态 。 

8 程序 从 x6203 开 始 恢复 执行 ， 直 到 x6210 的 RTI 指 令 结 束 。 超 级 用 户 栈 再 次 被 弹出 两 次 ， 恢 复 
的 是 程序 4 的 PSR 寄 存 器 内 容 ( 包 合 x3006 处 的 ADD 指 令 所 产生 的 条 件 码 信 息 )， 以 及 PC 寄存 器 的 
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内 容 (x3007), 

之 后 ， 由 于 程序 4 运行 在 用 户 模式 下 ， 所 以 R6 的 内 容 被 下 入 Saved.SSP， 更换 装 入 的 是 
Saved.USP 的 内 容 。 图 10-7e 所 示 是 此 时 的 超级 用 户 栈 和 PC 寄存 器 状态 。 

最 后 ， 程 序 4 从 x3007 的 指令 开始 ， 继 续 执行 。 


10.3 基于 栈 的 算术 运算 


10.3.1. 栈 的 临时 存储 作用 
有 些 计算 机 使 用 栈 (而 不 是 通用 寄存 器 ) 来 存放 计算 过 程 的 中 间 值 。 回 顾 我 们 的 ADD 指 令 ， 


ADD RO,R1,R2 

其 中 ，R1 和 R2 是 源 操作 数 ， 相 加 的 结果 存 和 人 R0。 之 所 以 将 LC-3 称 做 “3 地 址 机 器 ”(three- 
address machine) ， 是 因为 它 的 三 个 操作 单元 (2 个 源 操作 数 和 1 个 目的 操作 数 ) 都 是 显 式 表示 的 。 
而 在 采用 栈 方 式 的 计算 机 中 ， 源 和 目的 操作 数 的 位 置 都 没有 被 显 式 指明 。 例 如 : 

ADD 

我 们 称 这 类 机 器 为 “ 栈 式 机 ”(stack machine) 或 “ 零 地 址 机 器 ”(zero-address machine), RE 
默认 时 将 栈 顶 部 的 两 个 元 素 当 做 源 操 作 数 ， 并 将 它们 弹出 ， 送 给 ALU， 之 后 的 相 加 结果 又 压 回 栈 顶 。 

在 栈 式 机 上 的 加 法 操作 中 ， 硬 件 将 负责 两 次 弹出 、 一 次 加 法 和 一 次 压 人 。 其 中 ， 两 次 弹出 操 
作 将 把 两 个 源 数据 移出 栈 ， 加 法 负责 它们 的 求 和 ， 压 入 则 将 结果 放 回 栈 。 注 意 ， 弹 出 、 压 人 和 加 
法 都 不 属于 指令 集结 构 的 范畴 ， 因 此 它们 不 可 被 程序 员 所 用 。 它 们 只 是 供给 硬件 来 完成 具体 弹出 、 
压 入 和 加 法 运算 的 控制 信号 。 而 控制 信号 属于 “ 微 结构 ”(microarchitecture) 的 内 容 ， 与 在 第 4、5 
章 讨论 的 使 能 信和 号、 开关 选择 信号 是 同一 类 事物 。LC-3 的 LD 和 ST 指令 与 控制 信号 PCMUX 和 
LD.MDR 之 间 的 关系 也 如 此 。 在 栈 式 机 中 ， 程 序 员 只 需 告诉 计算 机 “执行 ADD”， 而 微 结构 将 负责 
所 有 的 具体 操作 。 

在 有 些 情况 下 (如 本 章 最 后 的 例子 )， 使 用 栈 结构 来 完成 算术 运算 非常 方便 (即将 中 间 结 果 存 
在 本 中， 而 不 是 存在 LC-3 的 RO~R7 寄 存 器 中 )。 大 多 数 微 处 理 器 (包括 LC-3) 都 采用 通用 寄存 器 方 
式 ， 而 大 多 数 计算 器 则 采用 栈 方 式 。 


10.3.2 例子 : 算术 表 达 式 


试 计 算 表达 式 (A48) - (C+D) 的 结果 ， 其 中 4 = 25、B = 7、C = 3、D = 2。 计 算 结果 存 人 
E。 如 果 LC-3 具 备 乘法 指令 (如 MUL)， 则 计算 过 程 如 下 面 代码 所 示 ; 


LD RO,A 
LD R1,B 
ADD RO,RO,R1 
LD R2,C 
LD R3,D 


ADD R2,R2,R3 
MUL RO,RO,R2 
RO,E 


ST 
而 如 果 是 计算 器 ， 则 执行 如 下 8 步 操作 即 可 : 


(1) push 25 
(2) push 17 
(3) add 

(4) push 3 
(5) push 2 
(6) add 

(7) multiply 

(8) pop E 


最 后 弹出 的 是 计算 结果 ， 即 210。 图 10-8 所 示 是 8 步 操作 中 每 一 步 操作 之 后 的 栈 快 照 。 
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x3FFB 
x3FFC 
x3FFD 
x3FFE 
x3FFF 
栈 指针 本 指针 栈 指针 
a) 之 前 日 第 一 次 压 人 之 后 c) 第 二 次 压 人 之 后 
x3FFB x3FFB 
x3FFC x3FFC 
x3FFD x3FFD 
x3FFE x3FFE 
| 42 | x3FFF x3FFF 
模 指针 eet LR 
d) 第 一 次 加 法 之 后 e) 第 三 次 讨 人 之 后 £)58 PU o Hs A ZZ Ji 
H1]. | xaFFB 
x3FFC 
| 2 | x3FFD | 2 | 
x3FFE 
x3FFF 





栈 指 针 


REE 


28) 第 二 次 加 法 之 后 bb) 乘法 之 后 i) 弹 出 之 后 


图 10-8 计算 (25+17) - (3+2) 的 程序 中 栈 的 使 用 情况 
在 10.5 节 中 ， 我 们 将 编写 一 个 LC-3 程 序 ， 使 其 表现 得 像 一 个 计算 器 (借助 键盘 和 显示 器 )。 我 
们 说 这 个 LC-3 程 序 “ 模 拟 ” 了 一 个 计算 器 。 
现在 ， 我 们 先 看 看 在 计算 器 模拟 中 ， 将 涉及 的 各 种 运算 操作 的 子 程序 。 


10.3.3 加 、 乘 和 取 反 

在 10.5 节 的 计算 器 模拟 器 中 ,我 们 可 以 输入 数值 ， 实 现 加 、 减 、 乘 等 操作 ， 并 可 显示 计算 结果 。 
为 执行 加 、 减 、 乘 运算 ， 我 们 需要 3 个 子 程序 : 

(1) 加 : 将 栈 顶 弹出 的 两 个 数值 相 加 ， 然 后 将 结果 压 回 栈 。 

(2) 乘 ， 将 栈 顶 弹出 的 两 个 数值 相 乘 ， 然 后 将 结果 压 回 栈 。 

(3) 取 反 操作 : 将 栈 顶 元 素 弹出 ， 对 其 取 反 ( 补 码 方式 ) ， 然 后 将 结果 压 回 栈 。 

1. 加 法 运算 

图 10-9 所 示 是 加 法 运算 的 流程 图 。 简 单 地 说 ， 先 试图 从 栈 顶 弹出 两 个 数值 ， 如 果 成 功 则 相 加 。 
如 果 计 算 结果 在 可 接受 值 范围 (一 999~+999)， 则 将 结果 压 入 栈 。 

有 两 种 情况 将 造成 运算 失败 ， 一 是 栈 内 元 素数 目 小 于 2， 二 是 计算 结果 超出 表达 范围 。 那 么 ， 
在 这 两 种 情况 下 ， 总 是 将 栈 恢 复 到 运算 前 状态 ， 并 在 R5 中 记录 数值 1 (代表 执行 失败 ) ， 然 后 返回 
调用 程序 。 如 果 第 1 个 元 素 的 弹出 就 失败 ， 栈 没有 变化 〈 因 为 POP 程序 没有 动 栈 ) ， 如 果 是 第 2 个 元 
素 弹出 失败 ， 那 么 栈 指针 回 弟 到 前 一 个 位 置 〈 即 等 价 于 将 刚才 弹出 的 值 压 回 栈 ) ， 如 果 是 最 后 的 计 
算 结果 超出 范围 ， 则 栈 指 针 回 减 两 个 位 置 (即将 两 个 源 操作 数 都 压 回 栈 )。 


图 10-10 所 示 是 加 法 运算 的 程序 。 


; 


Restore2 
Restorel 
Exit 


Routine to pop the top two 
add them, and push the sum 





将 第 一 个 弹出 的 放 回 


图 10-9 加 法 运算 的 流程 图 


the stack pointer. 


JSR 
ADD 
BRp 
ADD 


POP 
R5,R5, #0 
Exit 
R1,R0, #0 
POP 

R5, R5, #0 
Restorel 
RO, RO, R1 
RangeCheck 
Restore2 
PUSH 


R6,R6,s-1 
R6,R6,s-1 


elements from the stack, 
onto the stack. R6 is 


; Get first source operand. 

; Test if POP was successful. 

; Branch if not successful. 

; Make room for second operand. 
; Get second source operand. 

; Test if POP was successful. 

; Not successful, put back first. 
; THE Add. 

; Check size of result. 

; Out of range, restore both. 

; Push sum on the stack. 

; On to the next task... 

; Decrement stack pointer. 

; Decrement stack pointer. 





图 10-10 ”加 法 运算 
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其 中 ， 加 法 运算 调用 了 数值 范围 检查 (RangeCheck) 函数 ， 以 保证 该 结果 在 栈 空间 中 只 占用 
一 个 单元 大 小 。 我 们 将 数值 的 范围 定 为 -999~+999。 该 程序 已 完成 ， 在 10.5 节 的 计算 器 中 可 直接 调 
用 了 。 图 10-11 所 示 是 数值 范围 检查 的 算法 ， 其 对 应 的 LC-3 程 序 如 图 10-12 所 示 。 





打印 (超出 范围 的 数 ) 






图 10-11 范围 检查 函数 的 算法 流程 图 


Routine to check that the magnitude of a value is 
between -999 and 4999. 


RangeCheck R5,Neg939 
RA,RO,R5 ; Recall that RO contains the 


BadRange ; result being checked. 
R5,Pos999 

RA,RO,R5 

BadRange 

R5,R5,H0 ; R5 «-- success 


BadRange R7,Save ; R7 is needed by TRAP/RET. 
RO,RangeErrorMsg 
x22 ; Output character string 
R7, Save 
R5,R5,#0 ; 
R5, R5, #1 ; R5 «-- failure 


Neg999 . 45-999 
Pos999 . #999 
Saye . x0000 
RangeErrorMsg . x000A 
.STRINGZ "Error: Number is out of range." 





图 10-12 范围 检查 程序 

2. 乘法 运算 

图 10-13 所 示 是 乘法 运算 的 流程 图 ， 对 应 的 LC-3 程 序 如 图 10-14 所 示 。 同 加 法 运算 一 样 ， 乘 法 
运算 试图 从 栈 里 弹出 两 个 值 ， 如 果 成 功 则 相 乘 。 但 是 ， 由 于 LC-3 不 具备 乘法 指令 ， 所 以 我 们 需 采 
用 以 前 的 做 法 ， 即 通过 一 连 串 的 伏 加 来 实现 乘法 。 如 图 10-14 所 示 ， 行 17~19 是 实现 乘法 的 代码 。 
最 后 ， 如 果 计 算 结 果 在 有 效 范围 内 ， 则 将 它 压 人 栈 。 

其 中 ， 如 果 两 个 弹出 栈 操 作 中 任 一 个 失败 ， 则 通过 栈 指针 递减 ， 将 已 弹出 的 数值 压 回 栈 中 。 
如 果 计 算 结 果 超 出 可 接受 范围 ， 则 如 之 前 一 样 ， 对 RS 赋值 1 (表示 执行 失败 ) ， 并 将 栈 指针 递减 两 
次 ， 以 将 两 个 源 操 作 数 都 压 回 栈 。 





只 放 回 第 一 个 被 弹出 的 


图 10-13 乘法 运算 的 流程 图 


3. 取 反 运算 

之 前 的 加 法 和 乘法 操作 ， 都 是 对 栈 顶 的 两 个 元 素 进行 运算 。 如 果 对 栈 顶 的 两 个 元 素 做 减法 操 
作 ， 则 只 需 在 运算 式 中 ， 将 栈 顶 元 素 替 换 为 它 的 负数 形式 ， 然 后 再 执行 加 法 即 可 。 换 名 话说 ， 假 
设 栈 顶 元 素 为 4， 栈 的 第 二 个 元 素 为 B。 我 们 希望 弹出 的 是 4 和 8， 压 人 的 是 B-4。 那 么 ， 我 们 可 以 
先 对 栈 顶 元 素 4 取 反 ， 然 后 再 做 加 法 运算 。 

图 10-15 所 示 是 栈 顶 元 素 的 取 反 算法 (OpNeg). 
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Algorithm to pop two values from the stack, multiply them, 
and if their product is within the acceptable range, push 
the result onto the stack. R6 is stack pointer. 


; 
i 
i 
了 
H 


OpMult R3,R3,#0 ; R3 holds sign of multiplier. 
POP ; Get first source from stack. 
RS,R5,#0 ; Test for successful POP. 

Exit ; Failure 

R1,RO0,ft0 ; Make room for next POP. 

POP ; Get second source operand. 
R5,R5,#0 ; Test for successful POP. 
Restorel ; Failure; restore first POP. 
R2,R0, #0 ; Moves multiplier, tests sign. 
PosMultiplier 

R3, R3, #1 ; Sets FLAG: Multiplier is neg. 
R2,R2 

R2,R2,#1 ; R2 contains - (multiplier). 


PosMultiplier RO,RO,40 ; Clear product register. 
R2,R2,#0 
PushMult ; Multiplier = 0, Done. 


MultLoop . RO,RO,R1 ; THE actual "multipiy" 
R2,R2,48-1 ; Iteration Control 


MultLoop 


RangeCheck 
RS,R5,H0 ; R5 contains success/failure. 


Restore2 


R3,R3,H0 ; Test for negative multiplier. 
PushMult - 
RO,RO ; Adjust for 
RO, RO ,#1 ; Bign of result. 
PushMult PUSH ; Push product on the stack. 


Restore2 R6,R6,H-1 ; Adjust stack pointer. 
Restorel R6,R6,#-1 ; Adjust stack pointer. 


Exit 





图 10-14 乘法 运算 的 程序 


; Algorithm to pop the top of the sta i 
Ck, form its negati 
; and push the result onto the stack. F T 


OpNeg JSR POP ; Get the source operand. 
ADD R5,R5,40 ; Test for successful pop 


BRP Exit ; Branch if failure. 
RO, RO 
RO,RO,#1 ; Form the negative of source. 
PUSH ; Push result onto the stack. 





图 10-15 取 反 运算 


10.4 数据 类 型 转换 


有 关 数 据 类 型 的 讨论 ， 是 很 久 以 前 的 事情 了 ! 我 们 曾 接 触 过 多 种 数据 类 型 ， 包 括 地 址 运算 中 
的 无 符号 整数 ， 整 数 运算 中 的 “2 的 补 码 ”， 逻 辑 操 作 中 的 16-bit 二 进 制 位 数 ， 科 学 计算 中 的 浮 点 数 ， 
以 及 输入 输出 设备 数据 传输 中 的 ASCII 码 。 

对 于 各 种 指令 ， 确 保 其 源 操作 数 的 数据 类 型 的 正确 性 是 非常 重要 的 。 例 如 ，ADD 指 令 所 需要 
的 操作 数 是 补 码 形式 的 整数 。 而 如 果 给 ALU 提 供 浮 点 型 的 操作 数 ， 则 计算 结果 必然 是 无 意义 的 。 

在 高 级 语言 中 ， 也 不 难 找到 形式 如 4 =R + 1 的 指令 ， 其 中 R 代 表 浮 点 数 ，7 代 表 补 码 整 数 。 

如 果 按 照 浮 点 加 法 来 执行 ， 则 /是 个 问题 。 为 解决 这 个 问题 ， 我 们 需要 先 将 [从 原 数据 类 型 (2 
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的 补 码 ) 转换 为 操作 所 要 求 的 类 型 FAR). 
在 LC-3 中 , 也 有 这 样 的 数据 类 型 转换 问题 。 假设 从 键盘 读 人 多 个 整数 , 输入 的 是 ASCII 字 符 串 。 
但 要 对 它 做 算术 运算 ， 则 必须 先 将 它 转 换 为 补 码 整 数 。 而 要 将 一 个 补 码 形式 的 数值 值 显示 在 屏幕 


上 ， 则 又 需要 将 它 转换 为 ASCI 字 符 串 。 
在 本 节 中 ， 我 们 将 讨论 十 进 制 数 的 ASCI 字 符 串 和 它 的 补 码 二 进 制 数 之 间 的 转换 程序 。 


10.4.1 一 个 错误 结果 的 例子 : 2+ 3 = e 


图 10-16 所 示 是 数据 类 型 转换 的 例子 。 但 在 编程 时 ， 如 果 不 注意 数值 的 数据 类 型 ， 则 会 产生 如 
下 的 一 些 问 题 。 


; Input from the keyboard. 
; Make room for another input. 


; Input another character. 

; Add the two inputs. 

; Display resuit on the monitor. 
; Halt. 


图 10-16 不 注意 数据 类 型 的 加 法 


其 中 ， 假 设 我 们 希望 从 键盘 读 人 两 个 数 ， 然 后 相 加 ， 并 将 结果 显示 在 屏幕 上 。 刚 开始 ， 我 们 
可 能 会 写 出 如 图 10-16 所 示 的 代码 。 如 果 热 行 这 个 程序 ， 结 果 会 如 何 呢 ? 

假设 第 一 个 输入 是 2， 第 二 位 输入 是 3。 试 问 ， 程 序 结束 前 ， 屏 幕 上 显示 的 是 什么 ”输入 2 后 ， 
R0 装 入 的 是 2 的 ASCII 码 (HIx0032) ， 输入 3 后 ，R0 的 内 容 是 3 的 ASCIH 码 ( 即 x0033)。 然 后 ， 加 法 
指令 运算 的 是 x0032 与 X0033 之 和 ( 即 结果 为 x0065)。 最 后 ， 将 该 结果 显示 在 屏幕 上 ， 由 于 ASCI 码 
x0065 代 表 小 写字 母 “e”， 所 以 屏幕 上 显示 出 “e”。 | | 

为 什么 不 是 5 即 2+3 的 结果 呢 ? MAE: (1) 在 计算 之 前 ， 没 有 将 两 个 输入 字符 从 ASCII 码 转换 
为 补 码 整 数 ，(2) 在 输出 到 屏幕 之 前 ， 没 有 将 结果 转换 为 ASCII 码 。 

思考 题 : 修改 如 图 10-16 所 示 的 程序 ， 使 它 能 正确 执行 两 个 个 位 正 整 数 的 相 加 ， 并 输出 一 个 个 
位 正 整 数 和 。 假 设 两 数 相 加 的 结果 也 是 个 位 数 (没有 进位 ) 。 


10.4.2 ASC 山 二进制 转换 


我 们 必须 解决 多 位 数 的 表示 问题 。 图 10-17 所 示 是 采用 ASCII 码 表示 三 位 数 “295” 的 方式 。 其 
中 ， 我 们 按 ASCII 字 符 串 方式 ， 将 三 个 数字 存放 在 LC-3 内 存 中 标识 o — |] ASCIIBUFF 
ASCIIBUFF 起 始 的 三 个 连续 地 址 中 。R1 记 录 的 是 ASCIIBUF 起 始 内 
存 中 的 有 效 位 数 。 

其 中 ,每 个 ASCII 字 符 都 独自 占用 了 一 个 LC.3 字 (16-bit) 的 空间 。 
当然 ， 我 们 可 以 【也 应 该 ) 让 每 个 ASCII 字 符 占用 一 个 字 节 (8-bit) 
的 空间 。 但 在 此 ， 为 简化 算法 ， 我 们 将 整个 字 都 分 配给 了 一 个 ASCII 
字符 。 

图 10-18 所 示 是 将 ASCII 码 (如 图 10-17 所 示 ) 转化 为 二 进 制 整数 
的 算法 流程 图 。 其 中 ，ASCII 码 表示 数值 的 范围 必须 是 0~+999 之 间 ， ”图 10-17 以 ASCH 码 表示 形 
RON. AMTETS vtto 

在 该 算法 中 ， 我 们 依次 处 理 每 位 数字 。 对 于 每 位 数字 ， 只 取 其 数字 295 
二 进 制 值 的 最 低 4 位 。 然 后 ， 以 该 值 索引 对 应 的 数值 查找 表 (不 同 的 数位 有 不 同 的 表 ， 如 
LookUp10、Lookup100) ， 每 个 表 项 的 内 容 是 10 个 数字 对 应 的 数值 。 然 后 ， 将 每 位 数值 累加 入 RO， 
即 得 最 后 结果 。 
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R4 < 一 个 位 数 
RO <— RO + R4 
R1 «—R1-1 


R1?-0 
没有 数字 了 
No 


R4 < 一 十 位 数 
RO «— RO + 10 * R4 
R1 «—R- 1 


R4 < 一 百 位 数 
RO «— RO + 100 * R4 


图 10-18 将 ASCII 码 转化 为 二 进 制 的 算法 流程 图 
图 10-19 所 示 是 该 算法 对 应 的 LC-3 程 序 。 


This algorithm takes an ASCII string of three decimal digits and 


converts it into a binary number. 
R1 keeps track of how many digits are left to process. 


RO is used to collect the result. 
ASCIIBUFF 


contains the most significant digit in the ASCII string. 


ASCIItoBinary AND 





RO, RO,#0 ; RO will be used for our result. 


; Test number of digits. 
; There are no digits. 


R1,R1, #0 
DoneAtoB 
R3,NegASCIIOffset ; R3 gets xFFD0, i.e., -x0030. 
R2, ASCIIBUFF 


图 10-19 从 ASCII 码 到 二 进 制 的 转换 程序 
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R2,R2,R1 


R2,R2,É-1 ; R2 now points to "ones" digit. 





LDR R4,R2, #0 ; R4 <-- "ones" digit 
11 ADD R4, R4, R3 ; Strip off the ASCII template. 
RO, RO, R4 ; Add ones contribution. 












R1,R1,H-1 
15 BRz DoneAtoB ; The original number had one digit. 
16 ADD R2,R2,#-1 ; R2 now points to "tens" digit. 









R4 «-- "tens" digit 





R4,R2, #0 








; 
19 ADD R4, R4, R3 ; Strip off ASCII template. 
1A LEA R5, LookUp10 ; LookUp10 is BASE of tens values. 
1B ADD R5,R5,R4 ; R5 points to the right tens value. 
1C LDR R4,R5,#0 
RO, RO, R4 ; Add tens contribution to total. 








R1,R1,#-1 
20 BRZ DoneAtoB ; The original number had two digits. 
ADD R2,R2,ft-1 ; R2 now points to "hundreds" digit. 














R4,R2, #0 R4 «-- "hundreds" digit 







i 
24 ADD R4,RA,R3 ; Strip off ASCII template. 
25 LEA R5,LookUp100 ; LookUp100 is hundreds BASE. 
26 ADD RS5,R5,R4 ; R5 points to hundreds value. 
27 LDR R4,R5, #0 
28 ADD RO, R0, R4 ; Add hundreds contribution to total. 







29 ; 








2A DoneAtoB RET 

2B NegASCIIOffset .FILL  xFFDO 
2C ASCIIBUFF .BLKW 4 

2D LookUp10 .FILL #0 

2E .FILL #10 







.FILL 
.FILL 
.FILL 
.FILL 
.FILL 











34 .FILL #70 
35 ` .FILL #80 
36 -FILL #90 
37 H 

38 LookUp100 .FILL #0 
39 .FILL #100 






.FILL 
.FILL 
.FILL 
.FILL 










3E .FILL #600 
3F .FILL #700 
40 .FILL #800 






.FILL 





图 10-19 从 ASCII 码 到 二 进 制 的 转换 程序 (£3) 


思考 题 (一 个 非常 有 挑战 的 问题 ): 假设 该 十 进 制 数 的 长 度 是 任意 的 。 那 么 ， 我 们 不 仅 要 有 十 
位 和 百 位 的 数值 查找 表 ， 还 要 为 千 位 、 万 位 等 数字 各 准备 一 个 10 个 表 项 的 查找 表 。 此 时 内 存 空 间 
的 占用 太 大 了 。 请 设计 一 个 算法 ， 能 否 不 需要 查找 表 就 可 以 完成 转换 。 参 见习 题 10.20。 


10.4.3 二 进 制 /ASCII 转 换 


相反 ， 将 补 码 整数 转换 为 ASCIH 字 符 也 非常 必要 ， 例 如 将 结果 显示 在 屏幕 上 。 图 10-20 所 示 是 
该 转换 的 算法 。 其 中 ，R0 存 放 的 是 待 转换 的 补 码 整 数 ， 转 换 后 的 ASCII 字 符 串 存放 在 ASCIIBUFF 
起 始 的 4 个 连续 内 存 位 置 。RO 中 数值 的 范围 是 -999~+999。 地 址 ASCITBUFF 包 含 的 是 该 数值 的 符号 
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六 息 ， 随 后 的 三 个 地 址 分 别 对 应 三 位 数字 。 





; This algorithm takes the 2's complement representation of a Bigned 

; integer within the range -999 to +999 and converts it into an ASCII 

; String consisting of a sign digit, followed by three decimal digits. 

; RO contains the initial value being converted. 

j 

BinarytoASCII LEA R1,ASCIIBUFF ; R1 points to string being generated. 
ADD — RO,RO,40 ; RO contains the binary value. 
BRn NegSign D 
LD R2,ASCIIplus 





; First store the ASCII plus sign. 









0B STR R2,R1, #0 

oc BRnzp Begin100 

OD NegSign LD R2,ASCIIminus ; First store ASCII minus sign. 

OE STR R2,R1,40 

OF NOT RO,RO ; Convert the number to absolute 
10 ADD RO,RO, #1 ; value; it is easier to work with. 










11 ; 
Beginl00 





R2,ASCIIOoffset ; Prepare for "hundreds" digit. 





i 












14 LD R3,Neg100 ; Determine the hundreds digit. 

15 Loop100 ADD RO,RO,R3 

16 BR End100 

17 ADD R2,R2, #1 

18 BRnzp Loopi00 

19 i 

1A End100 STR R2,R1,H1 ; Store ASCII code for hundreds digit. 
1B LD R3,Pos100 

ic ADD RO,RO,R3 ; Correct R0 for one-too-many subtracts. 





R2,ASCIIoffset ; Prepare for "tens" digit. 





1F ; 

20 BeginlO LD R3,Neg10 ; Determine the tens digit. 
21 Loop10 ADD RO,RO,R3 

22 BRn End10 

23 ADD R2,R2,H1 





Loop1i0 







End10 STR R2,R1 ,#2 ; Store ASCII code for tens digit. 
27 ADD RO,RO,H10 ; Correct RO for one-too-many subtracts. 
29 Beginl LD R2,ASCIIoffset ; Prepare for "ones" digit. 
2A ADD R2,R2, RO 





R2,R1, #3 





ASCÍIplus 







2F ASCIIminus -FILL  x002D 
30 ASCIIoffset .FILL x0030 
31 Negi00 .FILL  xFF9C 
32 Pos100 .FILL x0064 





Neg10 


图 10-20 从 二 进 制 到 ASCII 码 的 转换 程序 


该 算法 的 工作 原理 如 下 所 述 。 首 先 ， 判 断 该 数 的 符号 ， 并 表示 为 对 应 的 ASCH 码 ， 然 后 ， 将 R0 
的 值 奉 换 为 其 绝对 值 ， 之 后 ， 将 R0 内 容 反 复 减 100， 直 到 为 负 值 (判断 百 位 上 的 数字 )。 依 此 类 推 ， 
测试 10 位 上 的 数字 。 最 后 剩 下 的 就 是 个 位 数字 。 

思考 题 : 在 该 算 革 中， 无论 是 什么 整数 ， 转 换 结 果 都 是 一 个 4 字符 长 的 字符 串 。 能 否 设计 一 个 
算法 ， 去 除 不 必要 的 字符 (如 前 缀 的 “0” 或 “+”)。 参 见习 题 10.22。 


10.5 模拟 计算 器 


本 章 的 最 后 ， 是 一 个 较 复杂 的 例子 : 模拟 计算 器 。 之 所 以 选 这 个 例子 ， 是 因为 其 中 涉及 到 很 
多 已 学 过 的 知识 。 同 时 ， 我 们 在 这 个 例子 中 ， 也 将 展示 一 个 完善 的 文档 和 清晰 的 编码 示例 。 相 比 
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之 前 的 那些 1~2 页 的 简单 例子 ， 该 设计 要 复杂 得 多 。 在 这 个 计算 器 模拟 程序 中 ， 有 11 个 相互 独立 的 
程序 。 我 们 希望 在 学 习 第 11 童 的 高 级 编程 语言 之 前 ， 攻 克 这 个 例子 。 

计算 器 的 工作 方式 是 : 通过 键盘 输入 十 进 制 数 和 操作 命令 ， 然 后 将 结果 输出 在 显示 器 上 。 算 
术 运 算 采 用 的 是 10.2 节 中 介绍 的 栈 机 制 。 输 入 和 输出 数值 都 限定 为 3 位 数 ， 即 一 999~+999 (包括 
一 999 和 +999)。 在 这 个 计数 器 中 ， 人 允许 的 操作 命令 包括 : 

X 退出 模拟 器 。 

D 显示 栈 顶 元 素 。 

C 清空 栈 内 所 有 元 素 。 

+ ”将 栈 顶 的 两 个 元 素 求 和 ， 并 替换 栈 顶 。 

” 将 栈 顶 的 两 个 元 素 求 积 ， 并 替换 栈 顶 。 

— 对 栈 顶 元 素 取 反 。 

Enter 将 键盘 输入 值 压 入 栈 。 i 

图 10-21 所 示 是 模拟 计算 器 的 概要 流程 图 。 计 算 器 模拟 程序 的 开始 是 初始 化 工作 ， 其 中 包括 设 
置 栈 指针 R6， 清 空 栈 ， 然 后 输出 信息 提示 用 户 输 入 。 









Se WR, ( 见 图 10-27) | 
S 加 法 操作 ( 见 图 10-10) n 
C» 乘法 操作 ( 见 图 10-14) 
No 
< > 取 反 操作 ( 见 图 10-15) 
. 显示 ( 见 图 10-24) N 
二 进 制 至 ASCH 码 转换 
EUER, (810-23) 
ASCI[ 码 至 二 进 制 转换 






















示 用 户 读 取 字 符 


图 10-21 计算 器 的 概貌 
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另外 ， 用 户 的 输入 将 被 回 显 (echo)。 同 时 ， 模 拟 器 将 分 析 用 户 的 每 个 输入 。 计 算 器 模拟 器 将 
根据 用 户 的 命令 执行 相应 的 操作 ， 然 后 提示 用 户 输入 下 一 个 命令 。 模 拟 器 不 断 如 此 重复 ， 直 到 用 
户 输入 “X”， 表 示 终 止 模拟 器 。 

整个 计算 器 模拟 器 由 11 个 程序 组 成 。 图 10-22 所 示 是 主 程序 ， 图 10-23 所 示 程 序 的 任务 是 将 用 户 
输入 的 ASCII 字 符 (数字 ) 转换 为 二 进 制 数 ， 然 后 压 和 人 栈 ， 图 10-19 所 示 是 ASCII 码 至 二 进 制 的 转换 
程序 ， 如 图 10-26 所 示 的 程序 ， 从 栈 顶 弹出 一 个 元 素 ， 并 将 其 转换 为 ASCII 字 符 串 ， 输 出 至 显示 
器 ， 图 10-20 所 示 是 二 进 制 数 至 ASCH 码 的 转换 程序 ， 如 图 10-10 (OpAdd)、 图 10-14 (OpMult) 和 
图 10-15 (OpNeg) 所 示 的 程序 ， 则 是 基于 栈 机 制 实现 的 各 种 基本 运算 方法 ， 如 图 10-24 和 图 10-25 
所 示 的 程序 ， 分 别 是 为 本 程序 定制 的 POP 和 PUSH 程序 ， 最 后 是 如 图 10-27 所 示 的 栈 清空 程序 。 


The Calculator, Main Algorithm 


LEA Re,StackBase ; Initialize the stack. 
ADD R6,R6,H41 ; R6 is stack pointer. 


LEA RO, PromptMsg 


; Check the 


Test Ri,NegX ; Check for X. 
R1,R1,RO0 
Exit 


R1,NegC ; Check for C. 
R1,R1, RO 
OpClear ; See Figure 10. 


R1,NegPlus ; Check for + 
R1,R1,RO 
OpAdd ; See Figure 10. 


R1,NegMult ; Check for * 
R1,R1,R0 
OpMult ; See Figure 10. 


R1,NegMinus ; Check for - 
R1,R1,R0 
OpNeg ; See Figure 10. 


R1,NegD ; Check for D 
ADD R1,R1,R0 
BRz OpDisplay ; See Figure 10. 


; Then we must be entering an integer 


BRnzp PushValue ; See Figure 10. 


? 
NewCommand LEA RO, PromptMsg 
PUTS 
GETC 
OUT 
BRnzp Test 
Exit HALT 
PromptMsg .FILL x000A 
.STRINGZ "Enter a command: 
NegX .FILL xFFA8 
NegC .FILL xFFBD 
NegPlus .FILL xFFD5 
NegMinus .FILL XFFD3 
NegMult .FILL xFFD6 
NegD .FILL xFFBC 


图 10-22 计算 器 的 主 程序 
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by the user, 





; This algorithm takes a sequence of ASCII digits typed 
; converts it into a binary value by calling the ASCIItobinary 
; subroutine, and pushes the binary value onto the stack. 


Ri,ASCIIBUFF ; R1 points to string being 






PushValue LEA 
LD R2,MaxDigits ; generated. 

07 ; 
08 ValueLoop - ADD R3,RO,xFFF6 ; Test for carriage return. 
09 BRz GoodInput 
0A ADD R2,R2,80 
0B BRz TooLargeInput 
oc ADD R2,R2,#-1 ; Still room for more digits. 
0D STR RO,R1, #0 ; Store last character read. 





R1,R1, #1 







; Echo it. 










11 BRnzp ValueLoop 

12 ; 

13 GoodInput LEA R2,ASCIIBUFF 

14 NOT R2,R2 

15 ADD R2,R2,H1 

16 ADD R1,R1,R2 ; R1 now contains no. of char. 
17 JSR ASCIItoBinary 

18 JSR PUSH 

19 BRnzp NewCommand 

1A i 

1B TooLargelnput GETC ; Spin until carriage return. 
IC OUT 

1D ADD R3,R0,xFFF6 

1E BRnp TooLargeInput 





RO,TooManyDigits 






NewCommand 


22 TooManyDigits .FILL x000A 
23 .STRINGZ "Too many digits" 


MaxDigits .FILL x0003 










图 10-23 计算 器 的 PushValue 程 序 


其 中 ， 为 使 各 程序 能 与 如 图 10-229 所 示 的 主 程序 配合 工作 ， 需 要 对 部 分 代码 做 出 修改 。 例 如 ， 
OpAdd、OpMult 和 OpNeg 等 程序 的 结尾 ， 都 将 更 换 为 如 下 指令 而 不 是 RET 指 令 ): 

BRnzp NewCommand 

此 外 ， 有 的 标识 符 (label) 在 多 个 程序 中 都 出 现 过 。 如 果 这 些 子 程序 都 是 单独 汇编 的 ， 但 这 些 
标识 符 被 标识 为 .EXTERNAL 类 型 〈 见 9.2.5 节 ) ， 则 在 多 个 子 程序 中 使 用 同名 标识 符 是 不 会 有 问题 的 。 
但 是 ， 如 果 这 些 程序 最 后 被 链接 为 一 个 模块 ， 则 标识 符 重 名 是 不 允许 的 。 所 以 ， 在 这 种 情况 下 ， 我 
们 必须 对 其 中 的 一 些 标识 符 重 新 命名 〈 如 Restore1、Restore2、Save 等 ) ， 以 保证 它们 的 惟一 性 。 


This algorithm POPs a value from the stack and puts it in 
02 ; R0 before returning to the calling program. R5 is used to 













03 ; report success {RS = 0) or failure (R5 = 1) of the POP operation. 
04 POP LEA RO,StackBase 
05 NOT RO, RO 
06 ADD RO, RO,#1 ; RO = -laddr.ofStackBase -1) 
07 ADD RO,RO,R6 ; R6 = StackPointer 
08 BRZ Underflow 
09 LDR RO, R6, #0 ; The actual POP 
0A ADD R6, R6, #1 ; Adjust StackPointer 
R5, R5, #0 ; R5 «-- success 











Underflow R7 , Save ; TRAP/RET needs R7. 
0E LEA RO,UnderflowMsg 
OF PUTS | ; Print error message. 
10 LD R7,Save ; Restore R7. 
11 AND R5,R5, #0 





R5.R5, #1 ; R5 «-- failure 





E1024 计算 器 的 POP 程序 


日 、” 原 书 中 此 处 为 “Figure 10.17”"。 结 合 上 下 文 ， 此 处 应 该 是 “图 10-22”。 一 译 者 注 
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Save ‚FILL x0000 


StackMax . BLKW 9 
StackBase .FILL x0000 


UnderflowMsgq .FILL x000A 
.STRINGZ "Error: Too Few Values on the Stack." 


图 10-24 计算 器 的 POP 程序 (5) 








This algorithm PUSHes on the stack the value stored in RO. 





R5 is used to report success (R5 - 0) or failure (R5 - 1) of 


i 
05 PUSH ST R1,Savel ; R1 is needed by this routine. 








03 the PUSH operation. 

04 

06 LEA R1,StackMax 

07 NOT R1,R1 

08 ADD R1,R1,H41 ; Ri = - addr. of StackMax 
09 ADD R1,R1,R6 ; R6 = StackPointer 

0A BRZ Overflow 

0B ADD R6,R6,#-1 ; Adjust StackPointer for PUSH. 
oc STR RO, RGE, #0 ; The actual PUSH 

oD BRnzp Success exit 

OE Overflow ST R7, Save 





R0, OverflowMsg 








R7, Save 
12 t LD R1, Savel ; Restore R1. 


13 AND R5,R5,40 
R5,R5,#1 ; R5 <-- failure 










Success_exit LD R1, Savel ; Restore R1. 
R5,R5,#0 ; R5 «-- success 










Save x0000 
Savel .FILL x0000 
OverflowMsg .STRINGZ "Error: Stack is Full." 






; This algorithm calls BinarytoASCII to convert the 2's complement 
; number on the top of the stack into an ASCII character string, and 
; then calls PUTS to display that number on the screen. 


OpDisplay ; RO gets tbe value to be displayed. 


NewCommand  ; POP failed, nothing on the stack. 
BinarytoASCII 
RO,NewlineChar 


RO, ASCIIBUFF 


R6,R6,it-1 ; Push displayed number back on stack. 
NewCommand 
NewlineChar  .FILL x000A 


图 10-26 计算 器 的 显示 程序 





i 
This routine clears the stack by resetting the stack pointer (R6). 


i 


OpClear R6,StackBase ; Initialize the stack. 
R6,R6,11 ; R6 is stack pointer. 


BRnzp NewCommand 





图 10-27 OpClear 程 序 


10.6 习题 


10.1 根据 栈 的 定义 ， 试 讲述 它 的 特征 。 

10.2. 试 比较 如 图 10-3 所 示 的 实现 模型 ， 相 比 图 10-2 所 示 的 模型 ， 它 有 什么 优点 ? 

10.3 ”假设 我 们 在 LC-3 指 令 集中 增加 了 Push 和 Pop 两 条 指令 。 其 中 ，Push Rn 的 任务 是 将 寄存 器 n 的 
内 容 压 人 栈 ，Pop Rn 的 任务 则 是 将 栈 顶 内 容 移 出 栈 并 赋值 给 Rn。 下 图 所 示 是 LC-3 的 8 个 寄存 
器 和 6 个 栈 操 作 ， 左 图 和 右 图 分 别 是 6 个 栈 操作 指令 执行 “之 前 ”和 “之 后 ”的 快照 。 请 比较 
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# 
两 个 快照 内 容 的 差别 ， 填 充 指令 中 标记 为 (a) ~ (d) 的 内 容 。 
BEFORE AFTER 
R0 x0000 PUSH R4 RO xliii 
RI x1111 PUSH (a) RI x1111 
R2 x2222 POP (b) RO x3333 
R3 x3333 PUSH (c) R3 x3333 
R4 x4444 POP R2 R4 x4444 
R5 x5555 POP (d) R5 x5555 
R6 x6666 R6 x6666 
R7 x7777 R7 x4444 
10.4” 试 编写 一 个 栈 操作 函数 一 peek。Peck 的 作用 是 只 读 取 栈 顶 元 素 的 内 容 ， 但 并 不 将 它 弹出 栈 。 
此 外 ，Peek 还 应 具备 栈 的 下 溢出 错 检查 。( 为 什么 不 做 上 溢出 错 检 查 呢 ? ) 
10.5 “如果 针对 如 图 10-2 所 示 的 栈 模型 ， 应 该 怎么 检查 上 溢出 和 下 溢出 错误 ? 试 重 写 PUSH 和 POP 
程序 ， 实 现 如 图 10-2 所 示 的 栈 模型 ( 即 每 个 栈 操作 都 将 引发 所 有 数据 的 移动 )。 
10.6 ” 试 重 写 PUSH 和 POP 程序 ， 使 栈 中 每 个 元 素 占用 两 个 内 存 位 置 。 
10.7 ” 试 重 写 PUSH 和 POP 程序 ， 使 栈 元 素 的 大 小 可 以 是 任意 长 度 。 
10.8 ”假设 我 们 对 栈 依 次 执行 以 下 操作 ， 试 问 ， 


10.9 


10.10 


10.11 


10.12 


10.13 


10.14 


10.15 


PUSH A, PUSH B, POP, PUSH C, PUSH D, POP, PUSH E, POP, POP, PUSH F 


a. PUSH F 执 行 之 后 ， 栈 的 内 容 是 什么 ? 
b. 什么 时 候 栈 中 包含 的 元 素 最 多 ? 假设 从 此 刻 开始 ， 继 续 执行 以 下 操作 : 


PUSH G,PUSH H,PUSH I,PUSH J,POP,PUSH K,POP,POP,POP,PUSH L,POP,POP,PUSH M 


c. 那么 ， 最 后 栈 中 的 内 容 是 什么 ? 

我 们 称 “ 栈 的 输入 流 ” 为 这 样 一 串 元 素 ， 它 们 是 被 压 人 栈 的 所 有 元 素 ， 并 按 其 压 人 栈 的 顺序 
排列 。 同 样 ， 我 们 将 “ 栈 的 输出 流 ” 定 义 为 被 弹出 栈 的 所 有 元 素 。 

假设 在 习题 10.8 中 ， 输 入 流 是 “ABCDEFGHIJKLM”。 试 问 ; 

a. 习题 10.8 中 的 输出 流 是 什么 (提示 : BDE…) ? 

b. 再 假设 输入 流 为 “ZYXWVUTSR”， 试 编写 一 个 由 PUSH 和 POP 组 成 的 操作 序列 ， 使 其 输 
出 流 为 “YXVUWZSRT”。 

c. 如 果 输 入 流 为 “ZYXW”， 请 问 有 多 少 种 不 同 的 输出 流 形式 ? 

在 中 断 服 务 程序 的 启动 阶段 ， 条 件 位 N、Z 和 P 都 是 存放 在 栈 中 的 。 试 给 出 例子 ， 说 明 在 不 
保存 条 件 位 的 情况 下 ， 会 发 生 什么 错误 。 

试问 ， 在 10.2.3 节 所 示 的 例子 中 ， 地 址 x6200 和 x6300 的 内 容 是 什么 ?它们 是 某 个 更 大 的 结 
构 体 (structure) 的 组 成 部 分 ， 请 给 出 这 个 结构 体 的 名 字 (提示 : 参考 表 A-3)。 

假设 我 们 对 10.2.3 节 的 例子 做 一 个 扩展 ， 使 得 设备 C 的 中 断 服务 程序 在 执行 X6310 指 令 时 ， 
发 生 一 个 优先 级 更 高 的 中 断 (设备 D)。 假 设 ， 设 备 D 的 陷入 矢量 是 xF3， 而 其 中 断 服务 程序 
在 地 址 x6400~x6412 处 。 试 给 出 程序 执行 过 程 中 ， 各 关键 点 的 栈 内 容 和 PC 值 快照 。 
假设 在 习题 10.12 中 ， 设 备 DD 的 优先 级 低 于 设备 C， 但 高 于 设备 B。 试 在 新 的 假设 下 ， 重 新 加 
答 习 题 10.12 的 问题 。 

试 编写 一 个 满足 如 下 需求 的 “键盘 输入 ”中 断 服务 程序 : 在 内 存 空间 x4000~x40FE 分 配 一 
个 缓存 。 在 中 断 处 理 程序 中 ， 读 和 人 下 一 个 输入 字符 ， 并 将 它 存 人 下 一 个 缓存 空位 。 内 存 
x40FF 的 内 容 是 指向 缓存 中 下 一 个 可 用 空位 的 指针 。 如 果 缓 存 已 满 ( 即 地 址 x40FE 已 存 有 字 
符 )， 则 在 屏幕 上 打印 消息 :;“Character cannot be accepted; input buffer full." 

参考 如 习题 10.14 所 示 的 中 断 服 务 函 数 ， 并 对 缓存 结构 做 如 下 修改 : 缓存 空间 调整 为 在 内 存 地 
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10.16 


10.17 


10.18 


10.19 


10.20 


10.21 


10.22 


10.23 


#10 Ë 


址 x4000~x40FC 之 间 。 内 存 x40FF 仍 然 是 指向 缓存 中 下 一 个 可 用 位 置 的 地 址 。 而 xz40FE 包 含 的 
是 起 始 字符 的 地 址 ，x40FD 包 含 的 是 缓存 中 字符 的 个 数 。 其 他 程序 可 以 从 缓存 中 直接 取 走 字 
符 。 试 按 如 下 要 求 修改 中 断 处 理 函 数 ， 如 果 x4000 的 字符 已 被 读 走 〈 即 起 始 字符 的 地 址 后 移 )， 
则 在 x40FC 被 占用 之 后 ， 下 一 个 可 填充 的 地 址 就 变 为 x4000。 同 样 ， 缓 存 满 了 之 后 ， 中 断 服务 
程序 则 在 屏幕 上 打印 ;“character cannot be accepted; input buffer full." 

以 习题 10.15 中 修改 后 的 中 断 服务 函数 ， 以 及 一 个 正在 从 缓存 中 取 走 字符 的 程序 为 场景 。 试 
间 ， 在 同一 时 刻 ， 中 断 服务 函数 正在 将 字符 写 人 缓存 ， 同 时 一 个 程序 正在 读 取 缓 存 ， 它 们 
能 否 同时 工作 ， 是 否 存在 什么 问题 ? 

试用 自己 的 语言 ， 描 述 图 10-14 所 示 的 乘法 OpMult 的 工作 原理 和 过 程 。 该 乘法 操作 总 共 执 
行 了 多 少 条 指令 ?以 乘 数 n 为 参数 表述 该 答案 。 注 意 : 如 果 同 一 条 指令 被 执行 5 次 ， 我 们 说 
它 执行 了 5 条 指令 。 试 编写 一 个 程序 ， 如 果 乘 数值 小 于 25， 则 它 使 用 更 少 的 指令 数 来 完成 该 
乘法 过 程 。 给 出 它 的 具体 指令 数 。 

试 修改 图 10-16 所 示 的 程序 ， 使 得 它 可 以 对 2 个 个 位 正 整数 相 加 ， 并 计算 出 一 个 个 位 的 正 整 
数 结果 。 其 中 ， 假 设 两 个 个 位 正 整 数 相 加 的 结果 也 是 个 位 正 整数 。 

试 修改 图 10-16 所 示 的 程序 ， 假 设 输 入 数字 都 是 个 位 十 六 进 制 正 整数 ， 且 这 两 个 数 相 加 的 结 
果 也 是 个 位 十 六 进 制 正 整 数 。 

图 10-19 所 示 是 一 个 将 ASCII 字 符 串 转换 为 二 进 制 值 的 算法 。 如 果 十 进 制 数 为 任意 长 度 ， 采 
用 千 位 数字 、 万 位 数字 的 数值 查找 表 是 不 合适 的 。 请 设计 一 种 更 有 效 的 转换 算法 。 

图 10-19 所 示 是 一 个 将 ASCII 字 符 串 转换 为 二 进 制 值 的 算法 。 试 扩展 该 代码 ， 使 其 可 以 将 
ASCII 字 符 表 示 的 十 六 进 制 数 转 换 为 二 进 制 数 。 其 中 ， 如 果 一 个 数字 的 前 缀 为 “x ， 则 认 
为 后 续 ASCII 字 符 (最 多 三 个 ) 是 一 个 十 六 进 制 数 ， 否 则 将 其 当做 十 进 制 数 。 

图 10-20 所 示 的 算法 ， 总 是 产生 一 个 4 字符 的 字符 串 (无 论 被 转换 数字 的 符号 和 大 小 如 何 )。 

试 设计 一 种 算 靶 ， 它 可 以 将 表达 式 中 不 必要 的 字符 去 除 。 例 如 ， 前 缀 中 的 连续 0 和 符号 “+” 

阅读 以 下 LC-3 人 代码， 试问 它 的 作用 是 什么 ? 


X3000 
R6, STACKBASE 


RO, PROMPT 
TRAP x22 
AND R1, R1, #0 
LOOP TRAP x20 
TRAP x21 
ADD R3, RO, #-10 ; Check for newline 
BRZ INPUTDONE 
JSR PUSH 
ADD | R1, R1, #1 
BRnzp LOOP 
INPUTDONE ADD R1, R1, #0 
BRz DONE | 
LOOP2 JSR POP 
TRAP x21 
ADD R1, R1, #-1 
BRp LOOP2 
DONE TRAP x25 
PUSH ADD R6, R6, 8-2 
STR RO, R6, #0 
RET 
POP LDR RO, R6, #0 
ADD R6, R6, #2 
RET 
PROMPT :STRINGZ ''Please enter a sentence: '' 


STACKSPAC .BLKW #50 
STACKBASE .FILL #0 
.END 
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10.24 ”回顾 习题 8.15 的 程序 ， 回 答 以 下 问题 : 


„ORIG x3000 
LD R3,A 
STI R3, KBSR 
LD RO, B 
TEST LDI R1, DSR 
BRZp TEST 
STI R0, DDR 
BRnzp TEST 
A .FILL x4000 
B .FILL x0032 
KBSR FILL xFE00 
DSR FILL XFE04 
DDR «FILL XFE06 
.END 


a. 假设 键盘 的 中 断 矢量 是 x34， 且 键盘 中 断 服务 程序 的 起 始 地 址 为 x1000， 键 盘 中 断 服 务 的 代 
码 如 下 所 示 。 试 问 该 服务 程序 的 操作 是 什么 ? 


.ORIG x1000 
LDI RO,KBDR 
TRAP x21 
TRAP x21 
. TRAP x25 
KBDR .FILL xFEO2 
.END 


b. 假设 问题 a 中 的 代码 正在 执行 ， 这 时 有 人 又 蔽 了 一 个 按键 。 试 问 屏幕 上 的 显示 是 什么 ? 


第 11 章 C 语 言 编程 概述 


11.1 我 们 的 目标 


茹 喜 ， 你 已 进入 本 书 的 第 二 部 分 ! 通过 第 一 部 分 的 学 习 ， 你 已 对 现代 计算 机 系统 的 底层 知识 
有 所 了 解 。 基 于 这 个 坚实 的 基础 ， 我 们 将 开始 学 习 高 级 语言 的 基础 编程 。 

在 本 书 第 二 部 分 中 ， 我 们 将 以 C 语 言 为 例子 ， 讨 论 有 关 高 级 语言 编程 的 基本 概念 。 在 整个 循序 
渐进 的 学 习 过 程 中 ， 每 遇 到 一 个 高 层 的 新 概念 ， 我 们 都 将 它 与 计算 机 系统 的 底层 相关 联 。 从 某 种 
意义 上 说 ， 我 们 将 破解 所 有 的 神秘 。 这 也 是 为 什么 采用 自 底 向 上 方法 的 理由 ， 我 们 希望 你 知道 计 
算 机 在 运行 程序 (你 自己 编写 的 ) 时 都 做 了 些 什么 ? 我 们 的 理念 是 ， 如 果 你 知道 “神秘 ”背后 的 
活动 ， 对 编程 的 理解 也 必然 会 更 进 一 个 层次 ， 即 达到 了 一 个 “真正 的 ”程序 员 所 具有 的 境界 。 

我 们 先 简单 回顾 一 下 本 书 第 一 部 分 的 内 容 。 在 前 10 章 中 ,我 们 描述 了 一 个 简单 计算 机 “LC-3”， 
它 是 一 个 “虚拟 机 器 *"， 虽 然 简 单 ， 但 具备 了 真实 计算 机 的 所 有 重要 特征 。LC-3 (事实 上 也 是 所 有 
现代 计算 机 ) 的 设计 理念 是 ， 任何 复杂 的 设备 都 是 由 基本 单元 有 机 地 互 连 而 成 的 。 例 如 ，MOS 管 
构成 逻辑 门 ， 逻 辑 门 构成 内 存 及 数据 通路 (data-path) 中 的 其 他 部 件 ， 而 内 存 和 数据 通路 又 构成 了 
整个 LC-3。 这 个 理念 是 计算 机 系统 中 的 一 个 重要 概念 ， 它 不 仅 存 在 于 硬件 设计 中 ， 同 样 也 适用 于 
软件 设计 。 也 正 是 基于 这 样 一 个 简单 的 设计 哲学 ， 我 们 实现 了 今天 的 异常 复杂 的 计算 机 系统 。 在 
介绍 完 LC-3 硬 件 组 成 之 后 ， 我 们 开始 了 基于 0 和 1 的 机 器 码 语言 的 机 器 编程 ， 之 后 又 介绍 了 LC-3 汇 
编 语 言 ， 同 机 器 语言 相 比 ， 它 表现 得 更 友好 、 更 清晰 ， 在 介绍 编程 的 同时 ， 我 们 还 阐述 了 “问题 
分 解 ”方法 ， 即 怎样 将 一 个 复杂 问题 分 解 为 用 LC-3 语 言 可 描述 的 子 问题 ， 随 后 是 1/0 操 作 ， 即 基于 
TRAP 子 程序 完成 输入 /输出 等 任务 。“ 问 题 分 解 ” 和 “ 子 程序 ”是 两 个 重要 概念 ， 它 们 不 仅 在 汇编 
高 级 编程 中 被 使 用 ， 在 本 章 开 始 的 高 级 语言 编程 中 也 非常 重要 。 在 本 书 中 ， 你 将 不 断 看 到 这 些 概 
念 的 出 现 。 

现在 开始 本 书 的 第 二 部 分 。 我 们 的 任务 是 介绍 有 关 高 级 语言 编程 的 基础 知识 (如 变量 、 控 制 
结构 、 函 数 、 数 组 、 指 针 、 递 轨 和 简单 数据 结构 等 )， 以 及 良好 的 编程 习惯 和 方法 。 我 们 将 以 C 语 
言 为 例 来 讲述 这 些 。 当 然 ， 本 书 的 目标 不 是 写 一 个 C 语 言 的 编程 大 全 。 之 所 以 在 这 里 讲述 C 语 言 ， 
是 希望 能 通过 细节 讲解 ， 揭 示 基 本 的 编程 方法 和 复杂 程序 的 编写 技能 。 读 者 如 果 希 望 了 解 更 多 的 C 
语言 细节 ， 请 参考 附录 D。 

通过 本 章 ， 我 们 将 完成 从 汇编 谱 言 编程 到 高 级 语言 编程 的 过 渡 。 因 此 ， 我 们 将 解释 高 级 语言 
产生 的 必要 性 ， 以 及 它 是 怎样 与 底层 系统 交互 的 。 最 后 ， 将 通过 一 个 简单 例子 认识 一 下 C 请 言 ， 例 
子 中 的 细节 是 C 语 言 编程 的 人 门 关键 。 

11.2 软 硬 件 结合 
在 计算 机 硬件 越 来 越 快 、 计 算 能 力 越 来 越 强 的 同时 ， 软 件 也 变 得 越 来 越 复 杂 。 软 件 开 发 面临 


很 多 困难 。 对 于 一 个 程序 员 来 说 ， 为 维持 软件 开发 过 程 的 简单 化 ， 提 出 了 开发 过 程 自动 化 〔 即 让 


计算 机 来 做 部 分 开发 工作 ) 的 需求 ， 这 成 为 一 个 必然 趋势 。 
正如 我 们 在 第 5、6、7 章 所 见 ，LC-3 汇 编 语 言 编程 要 比 机 器 语言 编程 简单 得 多 。 例 如 ， 在 汇编 
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语言 中 ， 我 们 采用 助 记 符 (mnemonic) 代替 原先 的 0、1 操 作 码 序列 ， 采 用 符号 标识 (symbolic 
label) 代表 地 址 。 与 机 器 码 相 比 ， 这 种 指令 与 地 址 的 表示 方法 让 我 们 的 阅读 感觉 更 舒服 。 

另外 ， 如 图 1-6 所 示 ， 汇 编 器 在 变换 层次 结构 中 还 起 到 了 衔接 “ 算 靶 层 ” 和 “指令 集体 系 结构 
(ISA， 即 机 器 指令 ) 层 ” 的 作用 。 但 这 还 不 够 ， 我 们 希望 进一步 衔接 “语言 层 ” 中 的 间距 。 于 是 ， 
高 级 语言 的 作用 就 体现 出 来 了 ， 它 的 存在 使 得 编程 ( 即 算 法 实现 ) 更 简单 了 。 下 面 ， 我 们 来 看 一 
下 高 级 语言 是 怎么 做 的 。 

。 数值 的 符号 命名 。 在 机 器 语言 中 ， 表 达 循 环 过 程 中 的 计数 器 (counter) 需要 选 定 一 个 内 存 
单元 或 寄存 器 来 存放 计数 值 。 换 名 话说 ， 这 个 内 存单 元 或 寄存 器 就 是 计数 器 。 为 了 下 次 访问 
计数 值 ， 我 们 必须 记 住 存放 它 的 位 置 (如 内 存 地 址 或 寄存 器 编号 ) 。 在 汇编 语言 中 ， 实 现 这 
点 已 经 比较 容易 了 ， 即 为 这 个 计数 器 地 址 设置 一 个 标识 (label), ee BOAR) 
中 ， 将 非常 简单 ， 我 们 只 需要 为 这 个 数值 分 配 一 个 名 字 (name) 及 类 型 (type)。 Bm 
级 语言 (更 具体 地 说 是 编译 器 ) 将 为 它 分 配合 Wm. HORREA. it 
较 而 言 ， 在 汇编 语言 中 需要 程序 员 手 工 指定 位 置 ， 并 注意 不 同类 型 的 数据 处 理 ， 如 字 节 、 半 

字 等 类 型 。 由 于 程序 中 会 出 现 大 量 的 数值 操作 ， 所 以 单 从 这 点 上 ， 高 级 语言 无 疑 提高 了 
编程 效率 。 
丰富 的 表现 力 。 在 表达 多 个 对 象 之 间 的 互 操作 时 ， 人 们 还 是 习惯 于 现实 世界 中 的 自然 表达 
方式 。 相 比较 而 言 ， 数 字 世 界 的 表达 方式 则 显得 “不 自然 ， 如 操作 时 需要 注意 对 象 类 型 是 
整数 、 字 符 还 是 浮 点 数 等 。 高 级 语言 中 采用 的 就 是 自然 表达 方式 ， 它 的 “友好 ”性 无 疑 提高 
了 程序 员 的 “表达 ”能 力 。 通 常 ， 在 机 器 语言 中 需要 花 大 量 代码 表达 的 “复杂 ”任务 ， 在 高 
级 语言 中 ， 可 能 只 需要 儿 条 语句 就 可 以 完成 。 例 如 ， 三 角形 面积 的 计算 ， 在 高 级 语言 中 ， 只 
需要 一 条 语句 : 


area = 0.5 * base * height; 


再 如 ， 存 在 很 多 条 件 执行 代码 ， 即 条 件 为 “ 真 ” 时 做 什么 事情 ， 条 件 为 “ 假 ”时 做 什么 事情 。 
在 高 级 语言 中 ， 这 类 任务 可 以 描述 为 “类 英语 ”的 表达 。 例 如 ， 当 条 件 “ 阴 天 ”(isItCloudy) 为 真 
EF, Wu "He ( 雨 爹 )”， 否 则 ,“ 取 (太阳 眼镜 )”。 如 果 用 C 语 言 来 表示 ， 可 以 采用 “控制 结构 ” 
(control structure) 表示 为 : 

if (isItCloudy) 

get(Umbrella), 

else 

get(Sunglasses); 

。 底层 硬 件 的 抽象 。 高 级 语言 对 底层 ISA 或 硬件 做 了 抽象 。 通 常 ， 底 层 指令 不 能 直接 支持 某 些 

操作 ， 如 LC-3 不 提供 整数 乘法 指令 ,解决 方法 是 LC-3 的 汇编 程序 员 需 要 编写 一 大 段 代 码 

(如 循环 加 ) 来 实现 等 价 的 乘法 函数 。 而 高 级 语言 通常 会 向 程序 员 提 供 完整 的 操作 和 集合 (大 

于 ISA 指 令 集 所 能 提供 的 )， 这 是 因为 高 级 语言 程序 在 生成 (或 编译 为 ) ISA 代 码 的 时 候 ， 高 

级 语言 负责 提供 相关 的 额外 代码 。 这 是 高 级 语言 的 又 一 特性 ， 它 使 得 程序 员 可 以 将 精力 集中 

在 真正 的 编程 任务 上 (而 不 是 底层 的 实现 细节 )。 

: 代码 的 可 读 性 。 由 于 采用 了 和 英语 相似 的 “控制 结构 ”表示 ， 程 序 变 得 更 容易 被 阅读 和 理 

解 。 相 比较 而 言 ， 在 汇编 语言 中 ， 表 达 “ 循 环 "、“ 条 件 判 断 ” 等 结构 则 要 困难 得 多 。 如 果 

你 没 意 识 到 这 点 , 那么 很 快 你 就 会 意识 到 代码 的 可 读 性 在 编程 中 的 重要 性 。 作为 一 个 程序 员 ， 

经 常会 调试 别人 的 代码 。 如 果 代 码 的 语言 是 自然 、 友 好 的 ， 那 么 理解 它 就 将 变 得 容易 。 

。 可靠 性 的 保证 。 在 高 级 语言 中 ， 存 在 严格 的 规则 ， 程 序 在 翻译 或 执行 阶段 ， 将 接受 规则 检 

查 。 如 果 出 现 规则 或 条 件 冲 突 ， 则 打印 出 错 信 息 ， 提 示 代 码 中 可 能 存在 的 BUG 。 高 级 语言 
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的 这 种 特性 ， 能 提高 程序 员 的 编码 效率 。 


11.3 高 级 语言 翻译 


无 论 采 用 什么 编程 语言 (汇编 或 高 级 语言 ) ， 它 们 最 终 都 将 被 翻译 成 机 器 代码 ， 之 后 才能 被 底 
层 的 机 器 所 识别 和 执行 。 如 LC-3 汇 编 语言 ， 就 要 被 翻译 (或 汇编 ) 为 机 器 语言 ， 而 高 级 语言 更 要 
经 历 多 次 翻译 。 至 于 采用 什么 翻译 方法 ， 取 决 于 不 同 的 高 级 语言 。 方 法 一 是 解释 执行 
(interpretation) ， 负 责 翻 译 的 程序 被 称 为 “解释 器 ”(interpreter)， 它 读 入 高 级 语言 程序 ， 然 后 按 
照 高 级 程序 的 语义 执行 相应 的 操作 。 真 正 的 执行 者 不 是 高 级 语言 代码 本 身 ， 而 是 解释 器 程序 ， 方 
法 二 是 编译 执行 (compilation) ， 负 责 翻译 的 程序 被 称 为 “编译 器 ”(compiler) ， 它 将 高 级 语言 程 
序 读 入 ， 然 后 翻译 为 机 器 代码 ， 又 称 为 可 执行 映像 (executable image) ， 该 映像 是 可 以 直接 在 机 器 
上 执行 的 。 值 得 一 提 的 是 ， 无 论 解 释 器 还 是 编译 器 ， 其 本 身 也 是 一 个 程序 。 


11.3.1 解释 执行 . 


在 解释 执行 方式 中 ， 高 级 语言 程序 被 看 做 是 一 组 “命令 ”的 集合 。 解 释 器 逐个 读 人 每 条 命令 ， 
然后 按照 语言 规范 的 语义 完成 命令 (执行 相应 代码 ) 。 高 级 语言 程序 只 是 向 解释 器 提供 一 组 “数据 ， 
而 不 能 直接 被 硬件 执行 。 换 句 话说， 解释 器 如 同 是 一 个 虚拟 机 (virtual machine), ， 高 级 语言 是 在 
虚拟 机 (而 不 是 硬件 机 器 ) 上 被 执行 的 程序 。 解 释 器 每 次 处 理 一 个 片段 ， 即 一 行 语句 或 一 条 命令 ， 
其 至 是 一 个 子 程序 。 

通常 ， 解 释 器 以 行为 单位 ， 即 每 次 读 人 高 级 语言 程序 中 的 一 行 ， 然 后 在 实际 硬件 上 运行 一 段 
相应 的 代码 ， 表 现 出 高 级 语句 的 执行 效果 。 例 如 ， 高 级 语句 的 意思 如 果 是 :“ 求 变量 B 的 平方 根 ， 
并 将 结果 存 人 C”， 则 解释 器 将 执行 一 段 平方 根 求解 的 代码 。 如 此 反复 ， 解 释 器 执行 完 当 前 行 之 后 ， 
再 读 和 下 一 行 继续 执行 ， 直 到 整个 程序 结束 。 

采用 解释 执行 方法 的 语言 包括 LISP、BASIC 和 Perl 等 。 另 外 ， 一 些 专业 语言 也 采用 解释 方法 ， 
如 数学 语言 Matlab。 本 书 的 LC-3 仿 真 器 也 可 以 认为 是 一 个 解释 器 ， 还 有 如 UNIX 的 命令 行 执行 环境 
(shell) 也 属于 解释 器 。 


11.3.2 编译 执行 


在 编译 执行 方式 中 ， 整 个 高 级 语言 程序 全 部 被 翻译 成 机 器 码 ， 然 后 再 在 机 器 上 执行 。 为 保证 程 
序 翻 译 的 有 效 性 ， 在 翻译 之 前 ， 编 译 器 会 在 更 大 的 范围 内 做 分 析 (通常 是 整个 源 文件 ， 而 不 仅仅 是 
一 行 代码 ) 。 通 常 程序 只 需要 编译 一 次 ， 然 后 就 可 以 多 次 执行 。 编 译 类 型 的 高 级 语言 包括 C、C++、 
FORTRAN 等 。 本 书 中 ，LC-3 的 汇编 器 就 是 一 个 最 简单 的 编译 器 。 编 译 器 是 这 样 一 个 系统 ， 它 能 够 
处 理 (process) 一 个 或 多 个 包含 高 级 语言 程序 的 文件 ,生成 一 个 “可 执行 映像 ”(executable image) 。 
编译 器 本 身 不 执行 程序 ， 它 仅 负责 翻译 任务 ， 即 将 高 级 语言 转换 为 机 器 语言 。 


11.3.3 两 种 方法 的 优 缺 点 


两 种 翻译 技术 各 有 优 缺 点 。 解 释 执 行 中 ， 程 序 的 开发 和 调试 比较 方便 。 因 为 解释 器 每 次 执行 
一 段 (如 一 行 ) 即 输出 执行 结果 ， 也 就 是 说 ， 程 序 员 可 以 “在 线 ”(on-the-fly) 查看 中 间 结 果 并 修 
改 代码 。 另 外 ， 被 解释 执行 的 代码 具有 很 好 的 可 移植 性 ， 可 以 在 不 同 的 平台 得 以 执行 。 但 解释 执 
行 的 缺点 也 很 明显 ， 如 执行 时 间 太 长 ， 因 为 存在 执行 “中 介 ” 一 一 即 解释 器 。 相 比较 而 言 ， 编 译 方 


日 、 有 些 高 级 编译 器 确实 会 执行 程序 ， 为 的 是 获取 程序 的 profile 信 息 ， 优 化 编译 效果 。 一 一 译 者 注 
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式 下 程序 执行 速度 更 快 ， 内 存 开销 也 小 。 编 译 产生 的 代码 效率 更 高 ， 所 以 商业 软件 开发 大 都 选择 
编译 语言 。 
11.4 C 编 程 语言 

C 编 程 语言 是 Bell 实 验 室 的 Dennis Ritchie 于 1972 年 发 明 的 。C 语 言 的 发 明 初 囊 是 将 它 用 于 编译 
器 和 操作 系统 的 开发 ， 因 此 该 语言 的 设计 是 偏向 底层 的 。 换 句 话 说，C 语 言 可 以 对 底层 数据 进行 直 
接 操作 ， 同 时 它 又 兼备 高 级 语言 的 方便 性 和 表达 能 力 丰 富 等 特性 。 正 因为 如 此 ，C 语 言 成 为 当今 使 
用 最 广泛 的 语言 ， 而 不 仅仅 局 限 在 编译 器 和 操作 系统 的 开发 。 

C 语 言 在 编程 语言 的 发 展 史 中 占据 着 重要 的 地 位 。 图 11-1 所 示 是 各 主要 编程 语言 的 发 展 历史 。 
1954 年 诞生 了 历史 上 的 第 一 个 高 级 编程 语言 一 FORTRAN， 之 后 出 现 的 每 个 新 语言 ， 都 是 基于 前 
者 而 产生 的 。 但 我 们 却 很 难 确定 一 个 语言 的 “父母 "， 事 实 上 ， 对 任何 一 种 语言 来 说 ， 之 前 的 各 种 
语言 或 多 或 少 都 对 它 产生 了 一 定 的 影响 。 很 明显 ，C 语 言 对 C++ 和 Java 有 着 最 直接 的 影响 ， 而 后 者 
是 当今 最 重要 的 两 种 语言 。 同 时 ，Simula 语 言 的 面向 对 象 (object-oriented, OO) 特性 对 C++ 和 Java 
也 有 重要 影响 。 所 以 ， 本 书 讨论 的 C 语 言 特性 对 C++ 和 Java 也 同样 适用 。 换 名 话说， 掌握 本 书后 半 
部 分 内 容 ， 对 今后 的 C++ 和 Java 学 习 也 非常 有 帮助 ， 因 为 它们 和 C 语 言 非常 相似 。 





COBOL  : ; : ; 
: PLA Pascal : Ada: 


| BASIC 













s prem E: ; ; : 
LISP : : : : : ; : - 

; ; : Prolog : : : : : : 
055 1960 1965 1970 1975 1980 1985 1990 1995 2000” 
图 11-1 编程 语言 的 发 展 历史 : 几乎 每 种 新 语言 与 之 前 的 语言 之 间 都 存在 着 一 定 的 关联 ， 

C++ 和 Java 语 言 与 C 之 间 存 在 着 很 密切 的 关系 


鉴于 C 语 言 的 底层 特性 及 其 对 现代 语言 的 影响 力 ， 它 成 为 本 书 “ 自 底 向 上 ”计算 机 系统 分 析 过 
程 的 首选 高 级 语言 。 基 于 C 语 言 ， 我 们 很 容易 在 高 级 语言 和 底层 硬件 之 间 建 立 关联 。 至 于 高 层 概念 
中 的 面向 对 象 等 概念 ， 在 深入 理解 C 语 言 的 基本 概念 之 后 ， 只 需要 前 进 一 小 步 即 可 理解 。 

本 书 采用 的 C 语 言 遵 循 ANSI C 标 准 。 同 其 他 语言 一 样 ，C 语 言 也 产生 了 很 多 变种 。 为 此 ， 美 国 
国家 标准 学 会 (American National Standards Institute, ANSI) 于 1989 年 制定 了 一 个 “无 二 义 性 的 、 
机 器 无 关 的 C 语 言 定 义 ”(an unambiguous and machine-independent definition of the language C) ， 简 
称 为 ANSI C。 无 论 是 什么 样 的 C 语 言 变种 ， 它 的 编译 器 几乎 都 支持 ANSI C 标 准 。 也 就 是 说 ， 无 论 
在 什么 编译 器 上 编译 本 书 的 C 程 序 ， 只 要 该 编译 器 是 ANSI C 兼 容 的 ， 都 可 以 顺利 通过 编译 和 执行 。 


C 编 译 器 

C 编 译 器 是 一 个 标准 的 翻译 器 典范 ， 它 能 够 将 C 源 程序 翻译 为 一 个 可 执行 映像 。 人 参考 7.4.1 节 的 
定义 ， 可 执行 映像 是 一 个 用 机 器 语言 表示 的 、 上 其 备 内 存 装载 信息 的 可 执行 程序 。 整 个 编译 过 程 将 
涉及 预 处 理 器 (preprocessor)、 编 译 器 和 链接 器 (linker) 等 组 件 。 通 常 ， 我 们 将 它们 统称 为 “ 编 
译 器 ”(compiler)。 编 译 器 在 处 理 过 程 中 ， 将 自动 调用 预 处 理 器 和 链接 器 等 组 件 。 图 11-2 所 示 是 编 
译 过 程 中 各 组 件 之 间 的 协作 关系 。 
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库 代码 目标 文件 





图 11-2 虚线 框 内 是 编译 的 全 过 程 ， 包 括 预 处 理 器 、 编 译 器 和 链接 器 等 。 虽 然 编译 器 在 
其 中 只 是 爹 过 程 的 一 部 分 ， 我 们 仍 称 整 个 过 程 为 “编译 ”过 程 。 处 理 过 程 的 
输入 是 C 源 程序 和 头 文件 及 各 目标 库 文件 ， 输 出 是 一 个 可 执行 映像 


1. 预 处 理 器 

顾名思义 ，C 预 处 理 器 (preprocessor) 的 作用 就 是 : 在 正式 启动 编译 之 前 ， 对 C 程 序 做 “ 预 处 
理 ”， 然 后 将 预 处 理 结果 转交 给 编译 器 。C 预 处 理 器 将 扫描 所 有 的 C 源 文件 ， 寻 找 并 执行 其 中 的 预 处 
理 指令 。 预 处 理 指 令 与 LC-3 汇 编 语言 中 的 伪 操 作 指 令 非 常 相似 。 预 处 理 器 将 根据 这 些 指令 ， 执 行 
相关 的 源 文件 预 处 理 操作 。 例 如 ， 我 们 通过 预 处 理 指 令 通 知 预 处 理 器 将 代码 中 所 有 的 字符 捉 
“DAYS THIS_MONTH” 替换 为 数值 30， 再 如 ， 通 知 预 处理 器 将 文件 stdio.h 的 内 容 拷贝 至 源 文 件 的 当 
前 位 置 。 我 们 将 在 后 面 章 节 详 细 讨 论 它 的 作用 。 顺 便 提 一 下 ， 在 C 语 言 中 ， 预 处 理 器 指令 行 通 常 以 
“#” 开 头 。 几 乎 任何 C 程 序 都 将 直接 或 间接 使 用 预 处 理 器 。- 

2. 编译 器 

经 过 预 处 理 之 后 的 程序 ， 将 由 编译 器 (compiler) 继续 翻译 为 “目标 模块 ”(object module), 
参见 7.4.2 节 ， 目 标 模 块 是 程序 的 一 个 组 成 部 分 ， 是 机 器 语言 (或 目标 ) 代码 形式 。 编 译 过 程 包括 
两 个 阶段 : 一 是 “分 析 ”(analysis)， 或 称 为 “语法 分 析 ”(parsed)， 即 将 源 程序 分 解 为 更 小 的 组 
成 单元 ， 二 是 “合成 ”(synthesis)， 即 生成 机 器 语言 代码 。 分 析 阶 段 的 任务 是 读 入 、 分 析 源 代码 ， 
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并 构建 编译 器 内 部 格式 的 数据 结构 ， 而 合成 阶段 的 任务 则 是 生成 机 器 码 ， 以 及 根据 编译 指令 优化 
机 器 代码 。 如 果 将 这 两 个 阶段 进一步 细 化 ， 则 包括 分 析 (parsing)、 寄 存 器 分 配 (register 
allocation) 、 指 令 调 度 (instruction scheduling) 等 子 阶段 。 机 器 码 的 生成 操作 ， 可 以 由 编译 器 来 做 ， 
也 可 以 通过 调用 汇编 器 来 完成 。 

符号 表 (symbol table) 是 编译 器 中 非常 重要 的 一 个 内 部 数据 结构 ， 它 记录 了 程序 中 使 用 过 的 
所 有 符号 。C 编 译 器 的 符号 表 结构 和 LC-3 汇 编 器 中 的 符号 表 (参考 7.3.3 节 ) 非常 相似 。 有 关 C 编 译 
SUPE. RE TR REA. 

3. 链接 器 

所 有 的 目标 代码 (object code) 生成 之 后 ， 将 由 链接 器 完成 后 续 处 理 。 链 接 器 (linker) 的 任 
务 是 将 各 个 目标 模块 组 装 成 一 个 可 执行 映像 。 可 执行 映像 是 一 种 具有 特定 格式 的 机 器 语言 程序 ， 
具有 可 装载 和 可 直接 执行 这 两 个 特性 。 例 如 ， 在 PC 机 上 ， 当 你 点 击 Web 浏 览 器 中 的 图 标 时 ， 事 实 
上 你 是 在 告诉 操作 系统 :“ 从 硬盘 中 读 取 该 图 标 所 对 应 的 执行 映像 ， 将 其 装 入 内 存 ， 然 后 执行 ! ” 

C 程 序 对 库 函 数 的 依赖 非常 强 。 库 函数 中 包含 了 最 常用 的 一 些 操 作 函 数 (如 W/O 类 )， 它 们 以 库 
文件 的 方式 存在 。 这 些 库 函 数 通 常 由 系统 软件 (如 操作 系统 、 编 译 器 等 ) 的 开发 者 编写 。 在 用 户 
程序 中 ， 如 果 调 用 了 库 函 数 ， 则 链接 器 将 负责 查找 该 函数 在 库 文件 中 的 位 置 ， 并 拷贝 对 应 目标 代 
码 ， 然 后 “链接 ”人 可 执行 映像 。 有 关 程 序 与 库 函 数目 标 文件 之 间 的 链接 操作 ， 你 应 该 不 会 陌生 ， 
因为 在 9.2.5 节 的 LC-3 汇 编 过 程 中 ， 也 有 类 似 的 操作 。 值 得 一 提 的 是 ， 在 不 同 的 计算 机 系统 中 ， 库 
文件 的 存放 位 置 是 不 同 的 ， 如 UNIX 通 常 将 库 文件 放 在 /usr/1ib 目 录 下 。 


11.5 一 个 简单 的 C 程 序 


下 面 将 介绍 C 语 言 编程 的 概念 。 针 对 许多 C 概 念 ， 我 们 将 结合 LC-3 代 码 予 以 解释 ， 即 描述 C 代 
码 在 执行 时 ， 底 层 结构 中 都 做 了 什么 事情 。 在 本 书 中 ， 底 层 结 构 是 LC-3 指 令 集 体系 结构 ， 而 现实 
中 ， 你 可 能 面 对 其 他 类 型 的 结构 (如 x86)。 例 如 ， 如 果 你 的 机 器 是 一 台 Windows-based PC 机 ， 则 它 
的 体系 结构 就 是 x86。 也 就 是 说 ， 在 你 的 机 器 上 ，C 编 译 器 生成 的 是 x86 代 码 (而 不 是 LC-3 代 码 )。 

需要 声明 一 下 ， 在 本 书 中 ， 大 部 分 的 C 语 言 例 程 是 完整 的 ， 你 可 以 直接 对 它们 做 编译 并 运行 。 
但 为 了 使 描述 更 加 简洁 ， 有 些 例 程 是 不 完整 的 ， 即 需要 你 自己 补充 代码 。 因 此 ， 为 了 不 引起 混淆 ， 
以 后 我 们 称 之 为 “代码 段 ”( 而 不 是 程序 )。 

先 看 一 个 简单 的 C 程 序 。 图 11-3 所 示 是 它 的 源 代码 。 该 例 程 虽然 简单 ， 却 包含 了 许多 重要 的 C 
语言 概念 。 程 序 意图 非常 简单 :打印 提示 信息 ， 请 用 户 输入 一 个 十 进 制 正 整 数 ， 然 后 对 该 数字 倒 


计数 ， 直 至 它 变 为 0。 
Program Name : countdown, our first C program 


a positive number and counts down from that number to 0, 
displaying each number along the way. 


* 

* 

* 

* 

* Description : This program prompts the user to type in 
* 

* 

* 

* 


/* The next two lines are preprocessor directives */ 
#include <stdio.h> 

#define STOP 0 

/* Function : main */ 
/* Description : prompt for input, then display countdown */ 
int main() 





图 11-3 该 程序 提示 用 户 输入 一 个 十 进 制 正 整 数 并 将 它 倒 计 数 直至 0 
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/* Variable declarations */ 
int counter; /* Holds intermediate count values */ 
int startPoint; /* Starting point for count down  */ 


/* Prompt the user for input */ 


Countdown Program ====s=\n"); 
printf("Enter a positive integer: "); 
scanf ("$d", &startPoint); 


/* Count down from the input number to 0 */ 
for (counter = startPoint; counter >= STOP; counter--) 
printf("*dWMn", counter); 





图 11-3 该 程序 提示 用 户 输入 一 个 十 进 制 正 整数 并 将 它 倒 计 数 直 至 0 (5) 


刚 开始 时 ， 你 可 以 不 必 读 懂 程 序 中 的 每 一 行 语句 。 先 尝试 着 编译 一 下 该 程序 。 在 这 个 程序 中 ， 
需要 强调 的 概念 包括 : main 函 数 、 代 码 注 释 与 编程 风格 、 预 处 理 指令 、1/O 函 数 调用 四 个 内 容 。 


11.5.1 mai 函数 


从 第 17 行 的 “int main0” 语 句 开 始 ， 至 最 后 一 行 (第 31 行 ) 的 大 括号 “} ”为 止 ， 这 几 行 代码 
组 成 了 main 竺 数 的 函数 定义 。C 语 言 中 的 “函数 ”(function) 概念 与 LC-3 汇 编 语 言 中 的 “ 子 程 序 ” 
(subroutine) (第 9 章 ) 是 等 价 的 。 函 数 是 C 语 言 中 一 个 非常 重要 的 概念 ， 在 第 14 章 将 专门 介绍 这 个 
概念 。 而 main 函 数 又 是 一 个 特别 的 函数 : main 是 任何 一 个 C 程 序 都 必 备 的 函数 ， 它 代表 整个 程序 执 
行 的 起 始 。 在 ANSI C 中 ，main 的 返回 值 被 规定 为 一 个 整数 ， 或 者 称 main 函 数 的 类 型 是 整数 (如 第 
17 行 代码 “int main0” 所 示 )。 

在 本 例 中 ，main 函 数 可 分 为 两 个 部 分 : 

。 第 一 部 分 是 “变量 声明 ”(declaration)。 所 谓 变量 声明 ， 即 对 那些 在 函数 中 将 被 使 用 的 变量 ， 

如 counter 和 startpoint 等 ， 做 一 个 声明 。 变 量 是 高 级 语言 的 又 一 特性 ， 我 们 可 以 将 它 理 解 为 

”是 数值 的 符号 表示 。 

。 第 二 部 分 是 “ 语 身 ”(statement)。 语 句 表达 的 是 程序 的 执行 动作 或 行为 。 对 于 C 程 序 来 说 ， 

程序 的 全 部 执行 过 程 从 main 开 始 ， 逐 名 执行， 直到 main 函 数 的 最 后 一 条 语句 。 

下 面 开 始 介绍 本 例 中 所 用 到 的 各 个 语句 。 开 始 几 条 语句 (24-2647) 的 作用 是 ， 打印 提示 信息 
(提示 用 户 输入 一 个 正 整 数 ) ， 在 接收 用 户 输入 的 数值 之 后 ， 程 序 进 入 最 后 一 条 语句 ， 即 for 循 环 语 
名 (一 种 迭代 结构 ， 参 见 第 13 章 ) 。 循 环 计 数 从 用 户 输入 值 开 始 ， 每 次 倒 计 数 减 1， 直 到 计数 值 为 0。 
例如 ， 刚 开始 如 果 用 户 输 入 的 数值 是 5， 则 程序 执行 的 输出 结果 如 下 : 


===== Countdown Program ===== 
Enter a positive integer: 5 


我 们 注意 到 ， 每 行 代码 都 以 分 号 “，” 结 尾 。 在 C 语 言 中 ， 分 号 代表 一 个 声明 或 语句 的 结束 。 
编译 器 将 分 号 理解 为 “ 断 句 符 "， 它 是 编译 器 将 程序 分 解 为 各 个 语句 的 惟一 标识 。 


11.5.2 编程 风格 
C 语 言 是 一 种 风格 自由 的 编程 语言 。 换 名 话说 ， 程 序 中 字 与 字 之 间 、 行 与 行 之 间 的 空格 数量 不 
影响 程序 的 语义 ， 程 序 员 可 以 按照 自己 的 意愿 ， 自 由 组 织 程序 的 结构 ， 只 要 遵守 C 语 言 的 语法 规则 


即 可 。 基 于 自由 格式 的 代码 具有 更 强 的 可 读 性 。 例 如 ， 在 前 面 的 例子 程序 中 ，for 循 环 体 语 名 前面 的 
空格 〈 缩 进 ) 让 这 段 代码 显 得 非常 醒目 ， 再 如 ， 在 相 邻 语句 之 间 插 入 空 行 ， 能 将 整个 main 函 数 体 分 
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隔 成 明显 的 几 个 代码 段 。 当 然 ， 不 必 非 有 这 些 空 行 ,但 有 了 它们 ， 能 在 视觉 上 起 到 “分 隔 ” 代 码 段 
的 作用 。 “ 空 行 ”被 经 常 使 用 ， 它 将 一 段 复杂 的 程序 ， 从 视觉 上 分 成 了 相对 独立 的 几 个 部 分 。C 语 言 
的 编程 风格 有 多 种 流派 ， 本 书 采 用 的 是 最 基本 的 一 种 C 代 码 规范 (如 采用 缩 进 、 空 行 等 方式 )。 你 完 
全 可 以 创建 自己 的 风格 ,但 要 记 住 ,无 论 采 用 什么 风格 ， 无 非 是 通过 “格式 ”传达 程序 的 “含义 ”。 

C 语 言 中 的 注释 方式 与 LC-3 汇 编 语言 有 所 差别 。 在 C 语 言 中 ， 注 释 信 息 段 以 符号 “/*” 开 始 ， 
以 符号 “*/” 结 束 。 注 释 内 容 可 以 跨行 。 例 如 ， 在 本 例 中 包含 了 很 多 注释 ， 有 单行 的 也 有 多 行 的 。 
不 同 的 编程 语言 ， 其 注释 方式 也 总 是 不 同 。 如 C++ 语言 允许 注释 行 以 “/” 开 头 。 当 然 ， 无 论 哪 种 
注释 方式 ， 其 目的 也 都 是 一 样 的 : 提供 一 种 描述 机 制 ， 使 得 程序 员 能 够 用 人 类 语言 (而 不 是 计算 
机 语言 ) 对 代码 意图 做 辅助 说 明 。 

恰当 的 代码 注释 非常 重要 。 漂 亮 的 注释 必然 能 够 提高 代码 的 可 读 性 ， 帮 助 阅读 者 快速 理解 代 
码 。 例 如 ， 在 实际 的 代码 开发 中 ， 编 程 任务 通常 是 由 一 个 团队 共同 完成 ， 这 意味 着 一 段 代码 将 由 
多 人 共享 。 因 此 ， 为 了 保证 团队 的 工作 效率 ， 提 高 代码 的 可 读 性 ， 从 现在 开始 ， 你 就 应 该 注重 培 
养 对 代码 做 注释 的 习 价 。 

一 个 优秀 的 注释 风格 表现 为 : 在 每 个 源 文件 的 开头 都 会 提供 一 些 信 息 ， 和 概述 该 文件 中 代码 的 功 
能 ， 并 记录 该 文件 的 修改 时 间 和 修改 人 等 历史 信息 ， 此 外 ， 在 每 个 函数 (Aman) 开始 也 有 注释 ， 
描述 该 函数 相关 的 输入 、 输 出 参数 ， 进 一 步 ， 在 代码 中 也 要 适当 地 夹杂 “注释 ”， 以 辅助 对 特定 代 
码 段 的 阅读 理解 。 但 值得 注意 的 是 ,“ 过 度 注 释 ” 并 不 是 件 好 事 ， 这 不 仅 不 会 有 助 于 阅读 ， 反 而 将 
整个 代码 文件 搞 得 一 团 秆 ， 让 人 抓 不 住 重 点 。 请 不 要 “画蛇添足 ”， 不 要 写 那些 可 有 可 无 的 注释 。 


. 11.5.8 C 预 处 理 器 


之 前 ， 在 11.4.1 节 中 ， 我 们 已 对 C 语 言 的 预 处 理 器 做 了 简要 介绍 ， 它 是 发 生 在 编译 器 之 前 ， 对 
原始 C 程 序 进行 转换 的 一 个 操作 。 在 前 面 的 例子 中 ， 出 现 了 两 个 常用 预 处 理 指令 : #define 和 
#include。 事 实 上 ， 预 处 理 指令 的 种 类 有 很 多 ,但 在 本 书 中 只 涉及 这 两 种 。 

#define 指 令 的 用 法 虽然 简单 ， 但 功能 却 非常 强大 。 它 的 作用 是 ， 指 示 C 预 处 理 器 ， 将 程序 中 出 
现 的 所 有 “文本 X” 替 换 为 “文本 Y"。 专 业 的 说 法 是 ， 将 “ 宏 变 量 X 蔡 换 为 Y”"。 如 在 本 例 中 ， 
#define 将 把 文本 STOP 替 换 为 0。 即 源 代 码 


for (counter = startPoint; counter »- STOP; counter--) 


在 预 处 理 之 后 (编译 之 前 ) ， 将 被 转化 为 


for (counter - startPoint; counter >= 0; counter--) 


这 有 什么 用 呢 ? 我 们 在 程序 中 ， 经 常会 通过 ftdefine 创 建 一 些 常量 ， 如 : 


#define NUMBER OF STUDENTS 25 


4define MAX LENGTH 80 
#define LENGTH OF GAME 300 
fldefine PRICE OF, FUEL 1.49 
#define COLOR OF EYES brown 


其 中 ， 符 号 PRICE_OF_FUEL 代 表 石 油价 格 。 如 果 石 油价 格 变 化 了 ， 我 们 只 要 更 改 此 处 “ 宏 
PRICE_OF_FUEL” 的 定义 即 可 。 如 果 在 程序 中 会 频繁 地 使 用 “石油 价格 ”这 个 数值 ， 那 么 一 旦 价 
格 变动 ， 预 处 理 器 将 为 我 们 完成 所 有 替换 ， 即 我 们 只 在 宏 定义 处 修改 数值 ， 随 后 代码 中 所 有 读 石 
油价 格 处 的 数值 都 同步 变化 ， 岂 不 是 非常 方便 ! 注意 ， 最 后 一 个 例子 的 用 法 稍 有 不 同 ， 它 是 将 字 
符 串 “COLOR_OF_EYES” 替 换 为 另 一 个 字符 串 〈 而 不 是 常数 ) 一 一 “brown”。 值 得 一 提 的 是 ， 
编程 风格 的 惯例 是 将 宏 变量 的 名 字 都 用 大 写字 母 表示 。 

#include 指 令 的 作用 是 ， 通过 正文 方式 ， 指 示 预 处 理 器 在 此 插入 另 一 个 源 文件 。 直 观 地 说 ， 就 
是 将 另 一 个 文件 的 内 容 拷贝 至 #include 指 令 所 在 的 地 方 。 这 样 做 有 什么 意义 呢 ?” 随 着 C 语 言 编 程 的 
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深入 ， 你 将 理解 C 语 言 中 头 文 件 (header file) 的 用 处 。 例 如 ， 可 以 通过 头 文件 包含 #defines 宏 定义 
和 变量 声明 ， 以 供 多 个 源 文 件 共享 。 

以 头 文 件 stdio.h 为 例 ， 它 是 所 有 使 用 W/O 函数 的 C 程 序 都 必须 包含 的 一 个 头 文件 。 在 该 文件 中 ， 
定义 了 库 文件 中 与 WO 函 数 相 关 的 信息 。 通 过 预 处 理 指 令 “# 上 nclude <stdio.h>”， 就 在 编译 之 前 ,将 
stdio.h 文 件 的 内 容 插入 当前 源 代码 文件 。 

#include 指 令 的 表述 方式 有 两 种 : 


#include <stdio.h> 
#include "program.h" 


两 者 的 区 别 是 ， 前 者 使 用 尖 插 号 (< >) 包含 文件 名 ， 后 者 采用 双 引 号 (7) 包含 文件 名 。 括 
号 表示 让 预 处 理 器 在 指定 目录 中 搜索 该 头 文件 。 指 定 目录 的 位 置 由 系统 配置 决定 ， 该 目录 中 通常 
包含 了 系统 和 库 图 数 相 关 的 头 文件 (如 stdio.h) ， 然而, 有 时 我 们 会 自己 编写 头 文件 (应 用 相关 的 ) 。 
此 时 ， 则 可 以 采用 后 者 ， 即 以 双 引 号 指定 头 文件 名 ， 它 表示 让 预 处 理 器 在 当前 C 源 文件 所 在 的 目录 


中 搜索 头 文件 。 
再 次 提醒 一 下 ， 注 意 预 处 理 语句 的 结尾 处 没有 分 号 (;)。 这 一 点 与 11.5.1 节 提醒 的 不 一 样 。 之 


H 


所 以 不 同 ， 是 因为 #define 和 ##nclude 是 预 处 理 指令 ， 不 是 C 语 言语 句 (或 指令 )。 前 者 是 交 给 预 处 理 
器 执行 的 指令 ， 后 者 是 最 终 由 硬件 执行 的 指令 。 


11.5.4 输入 和 输出 


本 章 最 后 的 话题 ， 是 有 关 如 何在 C 程 序 中 使 用 输入 和 输出 功能 。 此 处 有 关 该 话题 的 描述 是 高 层 
的 ， 具体 的 底层 细节 将 在 第 18 章 中 展开 。 这 是 因为 只 有 到 那个 时 候 ， 我 们 才 将 积累 起 理解 底层 1/O 
操作 所 需要 的 足够 知识 。 任 何 程序 都 将 或 多 或 少 地 使 用 WO， 因 此 了 解 C 语 言 的 VO 操作 机 制 非常 必 
要 。 在 C 语 言 中 ， IO 操作 由 库 函 数 实现 ， 这 如 同 在 LC-3 中 ，IN 和 OUT 指 令 的 具体 操作 是 由 系统 软 
件 所 提供 的 服务 程序 完成 的 一 样 。 

在 例子 程序 中 有 三 处 代码 (第 24、25、30 行 ) 使 用 了 C 库 函数 提供 的 printf 操 作 ， 又 称 为 “ 格 
式 化 打印 输出 ”(print formatted), 。printf 函 数 的 作用 是 将 信息 输出 至 标准 输出 设备 〈 如 显示 器 ) 。 
输出 信息 表示 为 格式 化 的 字符 串 。 所 谓 “ 格 式 化 字 竺 品 "， 是 指 它 包含 两 方面 内 容 : (1) 文本 内 容 
的 输出 ，(2) 文本 中 内 骨 数 值 的 输出 格式 说 明 。 例 如 ， 下 面 语句 

printf("43 is a prime number."); 


将 在 输出 设备 上 打印 文本 
43 is a prime number. 


如 果 我 们 希望 除 文本 之 外 ， 在 输出 中 还 夹杂 一 些 数值 ， 且 数值 是 程序 运行 时 产生 的 (而 不 是 
预定 的 )， 那 么 我 们 可 以 在 格式 字符 串 中 指定 数值 的 输出 格式 。 例 如 : 

printf("*d is a prime number.", 43); 

在 格式 字符 串 中 包含 有 格式 符 “%d"。 它 表示 字符 串 后 面 的 第 一 个 数值 ， 将 以 十 进 制 数 形式 替 
换 格式 符 %d 在 字符 串 中 的 位 置 。 所 以 ， 输 出 的 结果 为 : 

43 is a prime number. 

下 例如， 下 面 是 printf 的 其 他 用 法 : 


printf("43 plus 59 in decimal is &d.", 43 + 59); 
printf("43 plus 59 in hexadecimal is $x.", 43 + 59); 
printf("43 plus 59 as a character is $c.", 43 + 59); 


在 第 一 个 printf 中 ， 格 式 符 %d 将 102 (43 + 59 的 结果 ) 以 十 进 制 数 方式 幅 入 输出 字符 串 ， 在 第 二 
个 例子 中 ， 格 式 符 %x 将 66 (102 的 十 六 进 制 值 x-66) 嵌入 字符 串 ， 同 样 ， 在 第 三 个 例子 中 ， 格 式 符 %c 
将 数值 以 ASCII 码 方式 嵌入 文本 (102 等 价 于 小 写字 母 “f” 的 ASCIH 码 )。 所 以 ， 第 三 个 输出 的 结果 是 ; 
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43 plus 59 as a character is f. 

比较 以 上 三 条 语句 ， 在 字符 串 尾 部 提供 的 数值 ， 其 二 进 制 值 都 是 一 样 的 ， 即 0110 O110 (十 进 
制 数 102)。 所 不 同 的 是 ，printf 的 理解 方式 不 同 。 在 第 一 个 语句 中 ， 它 被 解释 为 一 个 十 进 制 数 ， 在 
第 二 句 中 它 被 解释 为 十 六 进 制 数 ， 在 第 三 句 中 则 被 解释 为 ASCII 码 。 参 考 附 录 D 的 表 D-6 列 出 的 各 
种 printt 格 式 符 ， 其 中 所 有 的 格式 符 都 以 百 分 号 (90) 为 前 缀 。 

最 后 ， 再 给 出 printf 的 常用 方式 ; 

printf("The wind speed is $d km/hr.", windSpeed); 

其 中 ， 变 量 windSpeed 的 数值 是 程序 运行 时 产生 的 。 在 这 里 ， 它 将 以 十 进 制 数 方式 输出 。 假 设 
程序 执行 到 当前 printf 语 名 时， 变量 windSpeed 等 于 2 ， 则 输出 结果 为 

The wind speed is 2 km/hr. 

但 是 ， 如 果 你 写 一 个 程序 ， 将 前 面 5 条 printf 语 名 连续 执行 ， 将 发 现 一 个 问题 一 一 5 个 输出 挤 在 
同一 行 之 中 了 ， 即 没有 换行 。 如 果 需 要 显示 换行 ， 可 以 在 格式 字符 捉 中 需要 换行 的 地 方 添加 换行 
符 。 特 殊 字 符 如 换行 符 、 制 表 符 等 ， 在 格式 字符 串 中 出 现 的 时 候 ， 都 以 反 斜 杠 符 (\) 为 前 级 。 例 
如 ， 重 写 前 面 的 5 条 语句 ， 在 每 个 格式 字符 串 后 面 添加 换行 符 〈(m) ， 则 每 次 输出 之 后 都 将 换行 。 修 
改 后 的 printf 语 句 如 下 所 示 : 


printf ("$d is a prime number.\n", 43); 

printf("43 plus 59 in decimal is $d.Xn", 43 + 59); 
printf("43 plus 59 in hexadecimal is *x.WMn", 43 + 59); 
printf("43 plus 59 as a character is $c.Mn", 43 + 59); 
printf("The wind speed is td km/hr.Xn", windSpeed); 


注意 其 中 每 个 格式 字符 串 后 面 的 换行 符 (mm)。 参 考 附录 D 的 表 D-1 中 列 出 的 各 种 特殊 字符 表示 
方法 。 修 改 后 ，5 条 语句 的 输出 结果 如 下 所 示 : 


43 is a prime number. 

43 plus 59 in decimal is 102. 

43 plus 59 in hexadecimal is 66. 
43 plus 59 as a character is f. 
The wind speed is 2 km/hr. 


如 图 11-3 所 示 ， 例 程 中 有 三 处 调用 printf 语 名 。 在 前 两 个 的 输出 中 ， 只 有 文本 设 有 数值 (因而 
没有 格式 符 )。 第 三 个 输出 中 包含 变量 counter 的 数值 。 另 外 ， 在 一 个 printf 语 句 中 ， 事 实 上 可 以 输出 
多 个 数值 。 在 字符 串 中 出 现 的 格式 符 (如 %d) 数量 必须 与 跟随 在 字符 串 后 面 的 数值 数量 完全 相同 。 

SHE. 如 果 将 例 程 中 第 三 个 printf 蔡 换 为 如 下 形式 ， 结 果 会 如 何 ? 


printf ("$d %d\n", counter, startPoint - counter); 

在 讨论 了 许多 “输出 ”话题 之 后 ， 下 面 看 看 与 之 对 应 的 输入 函数 scanf。scanf 函 数 的 任务 是 : 
从 标准 输入 设备 (如 键盘 ) 读 和 人 字符 。 与 printf 相 似 ， 它 也 包含 两 部 分 内 容 ， 格式 化 字符 串 和 变量 
列表 (存放 读 和 人 的 值 )。scanf 将 按照 字符 串 中 的 格式 规范 ， 将 读 入 的 字符 转换 为 相应 格式 的 数值 ， 
然后 存 和 人 人 变量。 下面 看 一 个 例子 。 

如 图 11-3 的 例 程 所 示 ， 格 式 规范 %d 表 示 将 scanf 读 入 的 字符 转换 为 一 个 十 进 制 数 。 之 前 我 们 曾 
介绍 过 ， 在 LC-3 中 接收 到 的 键盘 字符 都 是 ASCII 编 码 形式 的 。 而 格式 规范 %d 则 向 scanf 函 数 传达 这 
样 一 个 信息 : 我 们 在 期 待 一 串 数字 ASCIH 键 (0-9) 的 输入 。 于 是 当前 接收 的 字符 串 将 被 转换 为 一 
个 十 进 制 数 ， 转 换 后 的 二 进 制 值 将 被 存 人 变量 startPoint。 注 意 ， 其 中 的 类 型 转换 工作 是 由 scanf 范 
数 完 成 的 。%d 只 是 scanf 众 多 格式 规范 中 的 一 个 ， 在 附录 DD 的 表 D-5 中 ， 列 举 了 所 有 的 scanf 格 式 规 
范 ， 如 单字 符 、 浮 点 数 、 十 六 进 制 整数 等 。 

需要 提醒 的 是 ， 那 些 将 由 scanf 填 写 的 变量 (如 startPoint) ， 之 前 都 有 一 个 前 缀 字符 (&), X 
看 起 来 有 些 神秘 ， 我 们 将 在 第 16 章 介绍 它 的 由 来 。 mE 
” 下面 看 看 更 多 scanf 的 例子 : 


202 # l$ 


/* Reads in a character and stores it in nextChar */ 
scanf("tc", &nextChar); 


/* Reads in a floating point number into radius */ 
scanf("*f", &radius); 


« 
/* Reads two decimal numbers into length and width */ 
scanfí("*d td", &length, &width); 


11.6 小 结 


在 本 章 中 ， 我 们 介绍 了 高 级 编程 语言 的 关键 特性 ， 并 对 C 语 言 编 程 有 了 初步 认识 。 下 面 ， 我 们 


将 对 本 章 的 主要 话题 做 个 总 结 。 


。 高 级 编程 语言 。 高 级 编程 语言 的 任务 是 简化 编程 工作 ， 将 底层 概念 与 现实 对 象 关联 起 来 。 
所 谓 底层 概念 ， 是 指 计算 机 能 处 理 的 位 及 其 位 操作 。 另 外 ， 由 于 计算 机 只 识别 机 器 代码 ， 所 
以 高 级 语言 必须 通过 翻译 或 解释 的 方式 转换 为 机 器 代码 。 

。C 语 言 。 对 于 自 底 向 上 过 程 来 说 ，C 语 言 是 一 个 非常 理想 的 语言 。 这 是 因为 它 本 质 上 的 底层 
特性 ， 以 及 它 对 现代 语言 的 深远 影响 。C 的 编译 过 程 涉及 预 处 理 器 、 编 译 器 和 链接 器 等 处 理 
阶段 。 

。 第 一 个 C 程 序 。 我 们 提供 了 一 个 非常 简单 的 程序 ， 并 通过 它 介绍 了 很 多 关键 的 C 语 言 特性 ， 
如 注释 、 缩 进 和 编程 风格 ， 它 们 对 程序 含义 的 传达 非常 重要 ， 有 助 于 阅读 者 更 好 地 理解 代 
码 ，C 程 序 中 通常 会 使 用 预 处 理 指令 #define 和 #include 锋 ， 任 何 C 程 序 执行 的 开始 都 是 函数 
main， 它 包含 了 变量 声明 和 语句 等 组 成 部 分 ， 最 后 一 点 是 ， C 的 1/O 操 作 可 以 通过 库 函 数 
printf 和 scanf 来 完成 。 


11.7 习题 


11.1 
11.2 
11.3 
11.4 


11.5 


11.6 


11.7 
11.8 


试 列举 低级 语言 编程 中 存在 的 问题 和 不 足 。 

试问 ， 高 级 语言 是 怎样 有 助 于 我 们 减少 低级 语言 编程 时 所 面临 的 不 足 的 ? 

请 问 高 级 语言 编程 存在 哪些 不 足 ? 

对 比 解释 器 执行 过 程 和 已 编译 二 进 制 代码 执行 过 程 之 间 的 区 别 。 评 价 一 下 解释 器 方法 的 性 
能 。 B 

语言 的 可 移植 性 是 指 其 代码 是 否 可 以 在 不 同 的 计算 机 系统 (或 者 说 是 不 同 的 ISAs) 上 运行 。 
请 阐述 为 什么 解释 语言 比 编译 语言 有 更 好 的 可 移植 性 。 

我 们 说 ，UNIX 命 令 行 是 一 个 解释 器 。 为 什么 不 说 它 是 一 个 编译 器 呢 ? 

试问 ，LC-3 仿 真 器 属于 编译 器 还 是 解释 器 ? _ 

与 解释 执行 相 比较 ， 编 译 执行 的 另 一 个 优点 是 ， 编 译 器 可 以 对 代码 做 更 彻底 的 优化 ， 这 是 因 
为 在 生成 机 器 代码 时 ， 编 译 器 对 整个 程序 进行 检查 ， 通 过 分 析 程 序 意 图 ， 尽 可 能 地 减少 程序 
计算 量 。 

如 下 所 示 算 法 ， 根 据 键 盘 输 入 值 ， 执 行 一 个 简单 计算 ， 并 将 计算 结果 输出 : 

(1) 从 键盘 读 人 W， 

(2) X 一 W+W 

(3) 立 一 X+XI 

(4)Z—Y-«Y, 

(5) 输出 Z 至 屏幕 。 

a. 如 果 是 解释 器 ， 则 逐 句 执行 整个 程序 ， 共 有 五 条 语句 。 请 问 在 该 程序 执行 过 程 中 ， 解 释 器 
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11.9 


11.10 


11.11 


11.12 


11.13 


至 少 要 执行 多 少 次 算术 运算 ? 请 详细 说 明 。 

b. 如 果 是 编译 器 ， 在 代码 生成 之 前 ， 将 对 整个 程序 做 分 析 ， 然 后 优化 代码 。 如 果 底 层 ISA 具 
备 所 有 的 算术 运算 能 力 (如 : 加 、 减 、 乘 、 除 )， 请 问 完成 该 程 序 至 少 需 要 执行 多 少 次 操 
fe? 请 详细 说 明 。 

根据 图 11-2， 回 答 以 下 问题 。 

a. 给 出 C 预 处 理 器 的 输入 ， 

b. 给 出 C 编 译 器 的 输入 ， 

c. 给 出 链接 器 的 输入 。 

如 图 11-3 所 示 程 序 ， 如 果 将 其 倒数 第 二 行 的 语句 

printf("%d\n", counter); 

分 别 替 换 为 如 下 语句 ， 请 问 结果 如 何 ? 

a. printf("$cWMn", counter + 'A'):; 

b. printf("$dMn$dMXn", counter, startPoint + counter); 


c. printf("$xWMn", counter); 
函数 scanf 的 功能 是 从 键盘 读 入 字符 ， 函 数 printf 的 功能 是 把 它 输出 至 屏幕 。 请 判断 下 面 两 条 
语句 的 操作 结果 ， 


'scanf("$c", &nextChar); 

printf("$dMn", nextChar); 

如 果 一 个 C 程 序 中 的 部 分 语句 如 下 所 示 ， 请 问 其 中 每 条 printf 语 名 的 输出 结果 是 什么 ? 
fdefine LETTER 'l' 

#define ZERO 0 

define NUMBER 123 

printf("$c", 'a'); 

printf("x$x", 12288); 

printf("S$$d.$c$dXn", NUMBER, LETTER, ZERO); 

请 描述 一 个 程序 (到 目前 为 止 ， 我 们 还 不 要 求 你 能 写 出 可 运行 的 C 代 码 )， 它 能 从 键盘 读 入 
一 个 十 进 制 数 值 ， 然 后 打印 出 等 价 的 十 六 进 制 数 。 


12.1 概述 


本 章 的 主题 是 高 级 语言 的 两 个 基本 概念 : 变量 (variable) 和 运算 符 (operator), EEREN 
是 存放 与 程序 运行 相关 的 数值 ， 运 算 蔡 是 语言 中 操作 这 些 数值 的 各 种 机 制 。 程 序 员 通过 变量 和 运 
算 符 ， 表 达 程 序 要 做 的 各 种 工作 。 

下 面 这 行 C 代 码 ， 是 一 条 包含 了 变量 和 运算 符 的 语句 。 该 语句 的 意思 是 : 通过 求 和 运算 符 (+) 
将 数值 3 与 变量 score 的 数值 相 加 ， 再 通过 赋值 运算 符 “=” 将 运算 结果 放 回 score 变 量 。 假 设 在 语句 
执行 之 前 score =7， 那 么 执行 之 后 变量 值 就 变 成 了 10。 

score = score * 3; 

在 本 章 的 第 一 部 分 中 ， 我 们 将 深入 学 习 C 语 言 的 变量 。C 语 言 的 变量 很 简单 ， 三 种 最 基本 的 类 
型 是 ， 整数 (integer)、 字 符 (character) 和 和 浮 点 数 (floating point number)。 在 变量 之 后 ， 是 本 章 
的 第 二 部 分 内 容 一 一 C 运 算 符 ， 而 这 部 分 内 容 却 非常 丰富 ， 为 此 我 们 提供 了 大 量 的 讲解 例子 。 在 本 
书 中 ， 讲 解 这 两 个 高 层 概 念 的 方法 也 很 特别 ， 我 们 始终 将 它们 与 底层 实现 相关 联 。 而 在 本 章 第 三 
部 分 内 容 中 ， 我 们 只 是 从 编译 器 的 角度 ， 讨 论 在 生成 机 器 代码 的 时 候 ， 怎 样 处 理 C 语 言 中 的 变量 和 
运算 符 。 最 后 ,我们 将 涉及 一 些 问题 求解 ， 以 及 一 些 与 C 变 量 和 运算 符 相关 的 细节 。 


12.2 变量 


所 谓 “ 数 值 "*， 泛 指 程序 执行 过 程 中 涉及 的 任何 数据 项 。 例 如 ， 在 循环 语句 中 使 用 的 循环 计数 
器 、 用 户 键 盘 输 入 的 键 码 值 、 求 和 运算 中 的 结果 值 等 都 是 数值 。 程 序 员 在 这 些 数 值 的 变化 追踪 上 ， 
要 花费 大 量 的 精力 。 

鉴于 数值 在 编程 概念 中 如 此 重要 ， 高 级 语言 从 程序 员 的 角度 ， 对 它们 的 管理 过 程 做 了 简化 设 
i: 高 级 语言 程序 员 可 以 采用 竺 号 方式 描述 这 些 数值 ， 即 使 用 名 字 (而 不 是 内 存 地 址 ) 来 引用 数 
值 ， 当 对 这 些 数 值 做 运算 操作 时 ， 高 级 语言 会 自动 添加 相应 的 数据 搬移 操作 。 换 名 话说 ， 程 序 员 
只 需要 关注 程序 的 编写 ， 而 不 需要 考虑 数据 保存 在 内 存 的 什么 地 方 ， 以 及 是 将 数值 放 到 寄存 器 还 
是 内 存 中 等 细节 问题 。 在 高 级 语言 中 ， 我 们 称 这 些 符 号 化 《有 名 字 ) 的 数值 为 “变量 ”。 

为 了 保证 变量 记录 的 正确 性 ， 高 级 语言 翻译 器 (如 C 编 译 器 ) 需要 事先 获知 变量 的 很 多 特征 ， 
首先 是 变量 的 符号 名 ， 其 次 是 变量 所 含 信息 的 类 型 ， 以 及 变量 在 程序 中 的 可 访问 范围 等 。 在 大 多 
数 的 高 级 编程 语言 中 (包括 C 语 圭 )， 是 通过 变量 声明 提供 这 些 特征 的 。 

下 面 看 一 个 例子 。 如 下 语句 声明 了 一 个 名 为 echo 的 变量 ， 它 可 以 存储 的 数值 类 型 是 整数 。 

int echo; 

基于 该 变量 声明 ， 编 译 器 将 在 内 存 中 为 echo 预 留 一 个 大 小 为 整数 的 空间 (当然 ， 为 优化 起 见 ， 
编译 器 也 可 将 echo 存 放 在 寄存 器 里 ， 而 不 是 内 存 中 。 有 关 话题 将 在 后 续 的 相关 课程 中 介绍 ) 。 之 后 ， 
C 代 码 访问 echo 变 量 时 ， 编 译 器 会 为 之 生成 相应 的 机 器 操作 码 。 


12.2.1 三 种 蕉 本 数据 类 型 . int, char, double 
至 此 ， 你 应 该 已 掌握 以 下 结论 : 一 个 特定 的 二 进 制 数 ， 其 含义 完全 取决 于 它 的 数据 类 型 。 例 
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如 ， 二 进 制 码 序列 0110 0110， 既 可 以 代表 小 写字 母 f{， 也 可 以 代表 十 进 制 数 102。 关 键 在 于 我 们 认 
为 该 数值 的 数据 类 型 是 ASCI 码 还 是 整 型 。 变 量 声明 的 作用 之 一 ， 就 是 向 编译 器 指明 该 变量 的 数据 
类 型 。 编 译 器 将 根据 该 变量 的 数据 类 型 ， 为 之 分 配 大 小 合适 的 存储 空间 。 另 外 ， 数 据 类 型 也 影响 
在 机 器 指令 级 别 上 操作 该 变量 的 运算 方式 。 例 如 ， 两 个 整 型 变量 的 加 法 操作 ， 在 LC-3 上 可 以 用 一 
条 APD 指 令 完成 。 但 如 果 是 两 个 浮 点 数 变量 ，LC-3 编 译 器 将 生成 一 组 指令 来 完成 它们 的 加 法 操作 
(因为 LC-3 不 具备 专门 的 浮 点 数 加 法 指令 )。 

C 语 言 支持 整 型 ， 字 符 型 和 浮 点 型 三 种 数据 类 型 ， CC 语句 中 对 应 的 类 型 说 明 符 分 别 是 int char 
和 double 〈 双 精度 浮 点 数 的 简称 ) 。 

1. int 

标识 符 int 所 声明 的 是 一 个 有 符号 整数 变量 。 整 数 类 型 的 内 部 表示 及 其 数值 大 小 的 范围 ， 取 决 
于 不 同 的 计算 机 指令 集结 构 (SA) 以 及 所 使 用 的 编译 器 。 例 如 ， 在 LC-3 中 ， 整 数 类 型 是 指 一 个 
16-bit 宽 度 的 二 进 制 补 码 ， 可 表达 的 数值 范围 是 一 32768~+32767。 而 在 一 个 x86 计 算 机 中 ， 整 数 类 
型 是 指 一 个 宽度 为 32-bit 的 二 进 制 补 码 ， 数值 范围 是 -2147483648~ 上 +2147483647 。 一 般 情 况 下 ，C 
语言 的 int 与 底层 ISA 的 字 长 《word length) 相对 应 。 

如 下 代码 声明 的 是 一 个 整 型 变量 numberOfSeconds。 当 编译 器 看 到 这 个 声明 的 时 候 ， 它 将 为 这 
个 变量 预 留 足够 的 空间 大 小 (以 LC-3 为 例 ， 即 一 个 内 存 位 置 )。 

int numberOfSeconds; i 

整数 类 型 在 程序 中 的 使 用 频 度 非常 高 。 它 们 通常 用 来 表示 在 真实 世界 中 被 处 理 的 各 种 数据 。 
例如 ， 表 示 了 时间， 以 秒 为 单位 ， 则 采用 整数 类 型 来 表示 再 合适 不 过 了 。 再 如 ， 在 鲸鱼 迁徙 研究 中 ， 
我 们 可 以 用 一 个 整数 变量 表示 那些 正在 离开 加 州 海 湾 的 灰 镶 数量。 同样， 在 程序 控制 中 ， 整 型 变 
量 也 非常 有 用 ， 循 环 计数 器 通常 也 是 整数 类 型 的 。 

2. char 

标识 符 char 表 示 该 变量 所 包含 的 内 容 是 一 个 字符 类 型 数据 。 如 下 所 示 是 两 个 char 类 型 变量 的 声 
明 ， 一 是 名 为 lock 的 变量 ， 二 是 名 为 key 的 变量 。 不 同 的 是 ， 在 第 二 个 声明 语 甸 中 包含 “初始 化 ” 
操作 。 在 C 语 言 中 ， 人 允许 变量 在 声明 之 时 对 其 赋 一 个 初始 值 。 例 如 ， 在 本 例 中 ， 变 量 key 的 初始 值 
为 大 写字 母 2 的 ASCI 码 值 。 注 意 ， 其 中 字母 2 是 被 单 引号 (U) 所 包围 的 。 单 引号 在 此 的 作用 是 ， 
表示 这 是 一 个 ASCI 字 符 值 。 那 么 ， 试 问 变量 lock 的 初始 值 又 是 多 少 呢 ? 稍 后 我 们 将 讨论 这 个 问题 。 


char lock; 
char key = 'Q'; 


对 于 ASCII 字 符 ， 一 个 8-bit 的 空间 就 足以 表示 任意 ASCIlI 字 符 。 但 在 本 书 中 ， 为 简洁 起 见 ， 所 有 
的 char 变 量 所 占用 的 空间 大 小 都 是 16-bit。 换 旬 话 说 ，char 与 int 一 样 ， 都 将 独自 占用 一 个 内 存 位 置 。 

3. double 

double 代 表 浮 点 类 型 变量 (参见 2.7.2 节 )。 浮 点 数 类 型 主要 用 于 表示 那些 包含 小 数 的 数值 ， 或 
者 是 非常 大 或 非常 小 的 数值 。 在 2.7.2 节 中 曾 提 到 ， 浮 点 数 的 具体 表示 包括 ， 符 号、 尾数 和 指数 等 
三 个 部 分 。 

以 下 是 double 类 型 变量 的 三 个 例子 : 

double costPerLiter; 


double electronsPerSecond; 
double averageTemp; 


与 int 和 char 相 同 ， 浮 点 类 型 变量 在 声明 之 时 也 可 以 被 初始 化 。 在 介绍 浮 点 变量 的 初始 化 操作 
之 前 ， 我 们 先 看 一 下 C 语 言 中 浮 点 数 的 表示 方法 。 在 如 下 语句 中 ， 我 们 看 到 ， 一 个 浮 点 数 ， 可 能 只 
有 尾数 部 分 ， 也 可 能 只 有 指数 部 分 ， 亦 或 两 者 都 有 。 字 母 e 或 E 之 后 标识 的 是 数值 ， 其 值 或 正 或 负 。 
指数 部 分 以 10 为 宕 ， 它 与 e 或 者 E 之 前 的 尾数 相 乘 ， 得 到 最 终 的 数值 。 注 意 ， 指 数 部 分 必须 是 一 个 
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整数 值 。 有 关 浮 点 数 更 多 的 描述 ， 参 见 附 录 D.2.4。 


double twoPointOne = 2.1; /* This is 2.1 */ 
double twoHundredTen = 2.1582; /* This is 210.0 */ 
double twoHundred = 252; /* This is 200.0 */ 
double twoTenths - 2E-1; /* This is 0.2 */ 


double minusTwoTenths = -2b-1; /* This is -0.2 */ 

在 C 语 言 中 ， 还 有 一 种 浮 点 类 型 是 foat。 所 不 同 的 是 ， 它 表示 的 是 单 精度 浮 点 变量 ， 而 double 
表示 的 是 双 精 度 浮 点 变量 。 回 顾 在 第 2 章 中 有 关 浮 点 数 的 描述 ， 一 个 浮 点 数 的 精度 取决 于 其 尾数 字 
段 的 位 数 。 而 在 C 语 言 中 ， 根 据 编译 器 以 及 指令 集结 构 的 不 同 ，double 的 尾数 位 数 可 能 大 于 float 的 
尾数 长 度 ， 但 绝 不 会 小 于 float 的 尾数 长 度 。 而 整个 double 数 所 占 空间 大 小 也 取决 于 具体 的 指令 集结 
构 和 编译 器 。 按 照 IEEE 754 浮 点 数 标准 ，double 类 型 的 长 度 通常 是 64 位 ， 而 foat 类 型 的 长 度 是 32 位 。 


12.2.2 标识 符 的 选择 


对 于 大 多 数 高 级 语言 ， 变 量 名 字 (又 称 “ 标 识 符 ”) 有 各 种 命名 规范 可 供 选 择 。C 语 言 规定 ， 
一 个 标识 符 可 由 字母 、 数 字 或 下 划 线 字符 C 组 成 。 其 中 ， 标 识 符 的 起 始 字符 可 以 是 字母 和 下 划 
线 字符 。 标 识 符 的 长 度 随 意 ， 但 事实 上 C 编 译 器 只 认 前 31 个 字符 。 另 外 ，C 编 译 器 对 字母 的 大 小 写 
敏感 ， 也 就 是 说 ， 在 C 语 言 中 ，Capital 和 capital 是 两 个 不 同 的 标识 符 。 

下 面 介绍 一 些 标 准 的 C 语 言 命 名 规范 : 

。 起 始 字符 为 下 划 线 的 变量 名 (An index ), 通常 只 用 于 标准 库 代码 中 。 

。 全 为 大 写字 母 的 标识 符 ， 通 常 上 只 用 于 预 处 理 指 令 #define 中 (参见 11.5.3 节 ) ， 变 量 名 不 会 全 

大 写 。 

。 多 单词 的 变量 名 。 从 视觉 上 ， 程 序 员 通常 会 对 变量 名 中 各 个 单词 做 出 分 隔 。 在 本 书 中 ， 我 

们 采用 大 写字 母 方法 (如 wordsPerSecond) , 而 有 的 程序 员 则 喜欢 下 划 线 方 革 (如 

words per second), 

变量 的 命名 在 代码 编写 中 非常 重要 。 变 量 名 应 该 能 反映 出 该 数值 的 特性 ， 它 有 助 于 程序 员 联 想 
到 变量 的 含义 。 例 如 ， 打 字 员 每 秒 钟 的 打字 速度 ， 其 变量 名 可 以 是 “wordsPerSecond”。 

值得 注意 的 是 ， 在 C 语 寺中 有 许多 关键 词 (reyword)， 它 们 具有 特殊 含义 ， 所 以 标识 符 命名 不 
能 与 它们 冲突 。 在 附录 D.2.6 中 ， 列 举 了 C 语 言 的 关键 词 。 例 如 ， 之 前 已 接触 过 的 “int” 就 是 一 个 
关键 词 ， 这 意味 着 我 们 不 能 将 任何 变量 命名 为 int， 否 则 代码 阅读 者 会 因此 而 困惑 。 编 译 器 在 翻译 
之 时 ， 也 会 对 此 出 现 二 义 性 问题 ， 因 为 编译 器 无 法 确认 它 是 代表 “int 变 量 ” 还 是 “int 类 型 ”。 


12.2.3 局 部 变量 和 全 局 变量 


如 前 所 述 ， 变 量 声明 的 作用 是 方便 编译 器 管理 变量 的 存储 问题 。 在 C 语 言 中 ， 程 序 中 的 变量 声 
明 是 向 编译 器 传递 以 下 三 类 信息 ; 变量 的 标识 竺 、 类 型 及 其 作用 域 。 有 关 前 两 者 ， 编 译 器 可 直接 
从 变量 声明 语句 中 获取 ， 但 是 ， 有 关 作用 域 ， 编 译 器 则 相通 过 声明 语句 所 在 的 位 置 推理 而 知 。 所 
谓 “ 变 最 的 作用 域 ”， 是 指 有 权 访 问 该 变量 的 代码 区 段 (或 者 说 是 变量 存活 区 域 )。 

幸运 的 是 ，C 语 言 的 变量 作用 域 只 有 两 类 : 一 是 “全 局 的 ”(global) (在 整个 程序 范围 内 可 访 
HS), ZÆ “ARR” (local) (只 在 当前 代码 块 有 效 ) 。 

1. 局 部 变量 | 

在 C 语 言 中 , 任何 变量 在 被 使 用 之 前 必须 先 声 明 。 有 些 变量 是 在 它们 所 在 代码 块 的 开始 处 声明 ， 
我 们 称 之 为 局 部 变量 (local variable) 。 这 里 所 说 的 “代码 块 "， 是 指 程序 中 的 一 段 代 码 ， 它 以 左 括 


日 ”这 个 说 灶 有 些 不 严格 。 事 实 上 ， 在 C 语 言 中 ， 可 以 标识 一 个 全 局 变量 是 在 当前 源 代码 文件 中 有 效 ， 还 是 在 
整个 程序 中 有 效 。 但 这 点 并 不 影响 我 们 在 此 的 讨论 。 
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号 “{ ”开始 ， 以 右 括号 “} ”结束 。 局 部 变量 的 声明 语句 通常 紧 随 在 左 括号 后 面 。 

下 面 的 代码 是 一 个 简单 的 C 程 序 ， 它 从 键盘 读 取 一 个 数字 ， 然 后 将 它 输 出 ， 显 示 在 屏幕 上 。 其 
中 ， 整 数 变 量 echo 的 声明 是 在 main 印 数 内 ， 这 意味 着 它 只 在 main 函 数 内 “可 见 ”， 而 在 main 国 数 之 
外 的 代码 区 域 是 无 靶 访问 该 变量 的 。 通 常 ， 局 部 变量 是 在 当前 代码 块 开 始 处 被 声明 ， 如 本 例 的 
echo 变 量 。 


#include «<stdio.h> 
int main(í) 
int echo; 


scanf ("$d", &echo); 
printf("$dWMn", echo); 


但 出 于 特殊 目的 ， 我 们 有 时 会 在 同一 个 函数 体内 ， 在 不 同 代 码 块 中 ， 声 明 两 个 名 字 完 全 相同 
的 变量 。 例 如 ， 在 同一 个 程序 内 ， 不 同 的 循环 体 中 ， 都 使 用 名 字 为 count 的 计数 器 变量 。C 诸 言 允 
许 这 种 声明 方式 ， 但 条 件 是 这 些 声 明 必须 在 不 同 的 代码 块 内 。 图 12-1 所 示 就 是 一 个 例子 。 
#include <stdio.h> 
int globalVar = 2; /* This variable is global */ 
int main() 
int localVar - 3; /* This variable is local to main */ 


printf ("Global td Local d\n", globalVar, localVar); 


int localVar - 4; /* Local to this sub-block */ 


printf("Global $d Local $d\n", globalVar, localVar); 


printf ("Global $d Local $dWin", globalVar, localVar); 





图 12-1 C 程 序 的 伐 套 作用 域 


2. 全 局 变量 

局 部 变量 只 能 在 当前 代码 块 中 被 访问 ， 与 之 相 比 ， 全 局 变量 则 可 以 在 程序 的 任何 地 方 被 访问 。 
换 名 话说 ， 它 们 在 整个 程序 的 生命 周期 内 ， 都 占有 独立 的 空间 及 其 内 容 。 

在 下 面 这 段 代码 中 ，main 子 数 同时 使 用 了 全 局 变量 和 局 部 变量 。 

#include «stdio.h» 

int globalvar = 2; /* This variable is global */ 
int main() 


int localVar - 3; /* This variable is local to main */ 


printf ("Global &d Local $&dWn*, globalVar, localVar); 


全 局 变量 在 特定 的 编程 环境 下 将 非常 有 用 。 但 初学 者 会 经 常 听 到 这 样 的 告 诚 :“ 尽 量 使 用 局 部 
变量 ， 少 用 全 局 变量 " 。 为 什么 这 么 说 呢 ? 因为 全 局 变量 是 公用 的 (public)， 它 可 以 在 程序 的 任何 
地 方 被 修改 。 这 意味 着 代码 可 能 存在 隐患 ， 对 它 的 修改 和 重用 需 格外 小 心 。 在 本 书 的 C 程 序 中 ， 几 
乎 只 使 用 局 部 变量 。 

下 面 看 一 个 更 复杂 的 例子 。 图 12-1 所 示 的 C 程 序 与 之 前 的 程序 非常 相似 ， 不 同 之 处 是 我 们 在 
main 函数 中 添加 了 一 个 子 块 (sub-block)。 而 在 该 子 块 中 ， 我 们 又 声明 了 一 个 localVar 变 量 ， 它 和 
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main 开 头 声明 的 局 部 变量 localVar 名 字 完 全 相同 。 但 你 将 发 现 ， 子 块 执行 时 ， 之 前 声明 的 localVar 
突然 不 可 见 了 。 也 就 是 说 ， 新 声明 的 同名 变量 替代 了 原先 的 同名 变量 。 但 是 ， 一 旦 子 块 结束 ， 之 
前 的 localVar 又 可 见 了 。 这 就 是 所 谓 的 “ 嵌 套 作用 域 ”(nested scope), 

3. 变量 初始 化 

至 此 ， 我 们 已 介绍 了 全 局 变量 和 局 部 变量 ， 现 在 开始 回答 之 前 的 问题 : “如 果 一 个 变量 没有 初 
始 化 ， 那 么 它 的 初始 值 是 多 少 呢 ? ”在 C 语 言 中 ， 局 部 变量 的 默认 初始 值 是 不 确定 的 。 因 为 ， 为 局 
部 变量 分 配 的 存储 空间 并 未 被 特意 清除 ， 它 包含 的 是 之 前 存储 在 此 的 内 容 。 我 们 通常 称 这 种 情况 
为 : 在 C 语 言 中 ， 局 部 变量 未 被 “初始 化 ”( 尤 其 是 “自动 存储 类 变量 ”(automatic storage class) ) 。 
与 之 相反 ， 全 局 变量 (以 及 所 有 其 他 “静态 存储 类 变量 ”(static storage class variable)) 在 程序 执 
行 之 前 ， 都 将 被 初始 化 为 0。 


12.2.4 更 多 的 例子 


下 面 我 们 将 列举 更 多 的 C 语 言 变量 声明 示例 。 其 中 ， 包 含 了 本 章 介绍 的 三 种 基本 数据 类 型 。 另 
外 ， 这 些 变 县 声明 中 ， 有 的 未 被 初始 化 ， 有 的 将 被 初始 化 。 尤 其 要 注意 其 中 的 浮 点 数 和 字符 的 C 语 
言 表 示 方 法 。 


double width; 

double pType - 9.44; 

double mass - 6.34E2; 

double verySmallAmount = 9.1094E-31; 
double veryLargeAmount = 7.334553E102; 
int average - 12; 

int windChillIndex - -21; 

int unknownValue; 

int mysteryAmount; 


char car = 'A';j 

char number = '4'; 

在 C 语 言 中 ， 还 可 以 使 用 十 六 进 制 数 ， 它 的 表示 方法 是 前 缀 “0x”"。 如 下 例子 是 3 个 十 六 进 制 整 
数 变量 的 初始 化 。 


int programCounter = 0x3000; 
int sevenBits = 0xA1234; 
int valueD = OxD; 


SEI: 在 以 上 声明 之 后 ， 如 果 执 行 语句 “printf("%d\n",valueD);”， 输 出 结果 是 什么 ?那么 
在 valueD 对 应 的 内 存 中 ， 存 放 的 二 进 制 数 又 是 什么 ? 


12.3 运算 符 


前 面 介 绍 了 C 语 言 变量 ， 下 面 将 介绍 C 语 言 的 运算 符 。 与 所 有 高 级 语言 一 样 ，C 语 言 也 支持 丰 
富 的 运算 符 集 合 ， 即 程序 员 可 以 对 变量 实行 多 种 操作 。 这 些 运算 符 中 ， 有 数学 运算 类 的 ， 也 有 到 
辑 运 算 类 的 ， 或 是 数值 比较 类 的 。 有 了 这 些 运 算 符 ， 程序 员 不 用 汇编 指令 ， 就 可 以 方便 简洁 地 表 
达 各 种 运算 。 

编译 器 所 做 的 工作 ， 则 是 将 C 代 码 转化 成 底层 硬件 能 够 识别 的 机 器 码 。 以 C 代 码 转换 成 LC-3 机 
器 码 为 例 ， 编 译 器 必须 把 C 程 序 中 的 各 种 操作 翻译 成 LC-3 指 令 集 支持 的 指令 。 显 然 ， 这 并 不 容易 ， 
因为 LC-3 支 持 的 操作 指令 种 类 非常 少 。 

为 了 更 好 的 阐述 这 个 观点 ， 我 们 以 一 条 简单 的 “两 数 相 莱 ” 语 句 为 例 。 其 中 ，x、y、z 都 是 整 
数 变量 ，x 和 y 的 乘积 结果 赋 给 了 z。 

Z-x*y; 

由 于 LC-3 不 支持 乘法 指令 ， 所 以 LC-3 编 译 器 必须 通过 一 段 代 码 序 列 ， 模 拟 两 个 整数 (甚至 可 
能 是 负数 ) 的 乘法 操作 。 一 种 可 行 的 解决 方法 是 ， 将 x 的 值 自身 倒 加 y 次 。 这 与 第 10 章 中 计算 器 例 
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子 的 代码 非常 相似 。 图 12-2 所 示 是 LC-3 编 译 器 为 上 面 的 C 语 句 生成 的 LC-3 机 器 码 程序 。 假 设 寄存 器 
5 (R5) 的 内 容 是 变量 x 的 内 存 地 址 ， 而 该 地 址 之 前 的 内 存 位 置 ( 即 R5-1) 存放 的 是 变量 y 的 数值 ， 
再 之 前 是 变量 z。 变 量 的 这 种 地 址 分 配方 式 看 起 来 有 些 奇怪 ， 其 中 的 原因 将 在 12.5.2 节 中 予以 解释 。 


RO <= 0 


load value of x 

load value of y 

if y is zero, we're done 

if y is positive, start mult 


y is negative 


R1 <= -X 


R2 <= -y (-y is positive) 


Multiply loop 
The result is in R2 





Z-x*y 


图 12-2 对 应 C 乘 法 语句 的 LC-3 代 码 


12.8.4 表达 式 和 语句 


在 这 入 学 习 运算 符 之 前 ， 我 们 先 介绍 一 些 C 语 言 的 语法 知识 ， 这 将 有 助 于 我 们 理解 C 程 序 。 我 们 
将 变量 、 常 量 值 与 运算 符 (如 乘法 ) 的 组 合 称 为 “C 表 达 式 ， 如 前 面 的 “x* y” 就 是 一 个 表达 式 。 

表达 式 之 间 的 组 合 则 构成 “ 语 自 "。 例 如 “z =x*y” 就 是 一 个 语句 。C 的 语句 与 英语 句子 相似 ， 
一 个 完整 的 句子 表达 的 是 一 个 想法 或 行为 ， 而 一 个 C 语 名 表达 的 是 计算 机 可 以 完成 的 一 个 操作 。C 
语句 以 分 号 “;” 或 右 大 括号 “}” 结 束 。 语 名 中 分 号 的 作用 如 同 英语 句子 中 的 标点 符号 。C 语 言 还 
有 一 个 有 趣 的 特点 ， 它 可 以 创造 一 个 不 表达 任何 任务 的 句子 ， 如 仅 有 一 个 分 号 的 语句 也 是 合法 的 ， 
即 “ 空 语 名 ”( 什 么 也 不 做 )。 

多 个 基本 语句 的 组 合 称 为 “复合 ”语句 或 “代码 块 ”( 由 左右 大 括号 {} 包 围 )。 从 语法 上 讲 ， 
复合 语句 等 价 于 基本 语句 。 下 一 章 ， 我 们 将 介绍 各 种 复合 语句 的 用 法 。 

下 面 是 简单 语句 、 复 合 语句 和 空 语句 的 例子 比较 。 


z2x*y; /* This statement accomplishes some work */ 
{ /* This is a compound statement */ 
已 =b+ er; 
i-p*r*t 
] 
k=k+1; /* This is another simple statement */ 
/* Null statement -- no work done here */ 


12.3.2 赋值 运算 符 

C 语 言 赋值 运算 符 的 符号 是 “=”( 读 作 “ 等 号 ")。 它 的 含义 是 ， 先 对 等 号 右边 的 表达 式 进 行 运 
算 ， 然 后 将 右边 表达 式 的 结果 冉 给 等 号 左边 的 对 象 。 例 如 ，C 语 句 

a=b +c; 

该 语句 的 作用 是 ， 将 表达 式 “b + c” 的 运算 结果 赋值 给 变量 a。 

值得 注意 的 是 ， 虽 然 数学 的 等 号 和 C 的 赋值 运算 符号 完全 一 样 ， 但 它们 的 含义 却 完全 不 同 。 在 
数学 中 ， 等 号 “=” 用 来 表示 右边 和 左边 的 表达 式 完全 相等 ,但 在 C 语 言 中 ,，“=” 运 算 符 用 来 表示 
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赋值 〈 即 传递 数值 )， 编 译 器 将 为 之 生成 合适 的 代码 。 
下 面 是 LC-3 编 译 器 为 CC 赋值 语句 生成 汇编 代码 的 例子 。C 语 句 的 作用 是 对 变量 x 原 数值 增 量 4。 


X= Xx+ 4; 

与 该 语句 对 应 的 LC-3 代 码 也 非常 简单 。 其 中 ，R5 的 内 容 是 变量 x 的 内 存 地 址 。 
LDR RO, R5, #0 ; Get the value of x 

ADD RO, RO, #4 ; Calculate x + 4 

STR RO, R5, #0 H X = 其 + 4; 


在 C 语 言 中 ， 表 达 式 的 计算 结果 是 “有 类 型 的 "。 在 这 个 例子 中 ， 表 达 式 “x + 4” 的 计算 结果 
是 整数 类 型 ， 因 为 数值 4 与 整 型 变量 (x) 之 和 也 是 整数 ， 结 果 也 是 赋 给 一 个 整 型 变量 。 那 么 ， 如 
果 我 们 将 不 同类 型 的 数 放 在 同一 个 表达 式 中 〈 即 类 型 混合 ) dn "x + 4.3”， 结 果 如 何 呢 9 C 语 言 的 
处 理 规则 是 ， 将 其 中 的 整数 转换 为 浮 点 数 。 如 果 表 达 式 同时 包含 整 型 和 字符 型 ， 则 其 中 的 字符 型 
被 转换 为 整 型 。 总 之 ，C 语 言 总 是 将 人 短 类 型 (shorter type). 转换 为 长 类 型 (longer types), HE, 
如 果 我 们 将 一 种 类 型 的 表达 式 结果 赋 给 另 一 类 型 的 变量 ,结果 如 何 呢 ? 如 “x = x 43", CEEI 
此 的 处 理 规则 是 ， 保 持 变量 类 型 不 变 ， 反 之 ， 将 表达 式 结果 转换 为 变量 类 型 。 如 本 例 中 ， 浮 点 表 
达 式 “x + 4.3” 的 结果 将 被 转换 为 整 型 (变量 x 的 类 型 ) 。 在 转换 过 程 中 ， 浮 点 数 的 尾数 部 分 将 被 
丢 旗 。 例 如 ， 浮 点 数 4.3 转 换 为 整数 后 结果 为 4， 若 为 5.9， 则 转换 为 5。 


12.3.3 算术 运算 符 


在 C 语 言 中 ， 算 术 运 算 符 相对 较 易 理解 ， 因 为 大 多 数 运算 及 其 符号 我 们 都 很 熟悉 ， 与 数学 课 上 
介绍 的 运算 符 完全 一 样 。 例 如 ,， “+” 代 表 加 法 ,，“ 一 ”代表 减法 ，“*” 代 表 乘 法 ( 稍 有 不 同 ， 主 要 
是 为 了 避免 它 与 字母 x 冲突 ),“/” 代 表 除法 。 另 外 ， 与 四 则 运算 规则 一 样 ， 表 达 式 运算 也 是 有 顺序 
要 求 的。 乘除 优先 ， 然 后 是 加 减 。 有 关 运 算 符 的 执行 顺序 ， 我 们 称 为 “优先 级 "， 下 一 节 将 详细 讨 
论 。 下 面 是 几 个 C 算 术 运 算 符 语句 。 

distance = rate * time; 

netIncome - income - taxesPaid; 

fuelEconomy = milesTraveled / fuelConsumed; 


area - 3.14159 * radius * radius; 
y = a*x*x + b*x + C; 


C 语 言 还 有 一 种 算术 运算 符 ， 你 可 能 不 太 熟 悉 ， 它 就 是 取 模 (modulus) 运算 符 “%”， 又 称 
“整数 取 余 运 算 符 ”。 我 们 将 以 两 数 相 除 为 例 ， 解 释 它 的 用 法 。 我 们 知道 ， 在 C 语 言 中 ， 整 数 相 除 时 ， 
尾数 部 分 将 被 丢弃 ， 结 果 只 保留 整数 部 分 。 例 如 ， 表 达 式 “11 / 4” 的 结果 等 于 2。 然 而 ， 取 模 运算 
符 % 求 解 的 是 除法 运算 的 余数 部 分 。 例 如 ，“11 % 4” 的 结果 等 于 3。 换 名 话说 ， 数 值 11 等 于 “(11 / 
4) *4+ (11 多 4) 。 在 如 下 例子 中 ， 变 量 的 类 型 都 是 整 型 。 


quotient = x / y; /* ix= 7 and y= 2, quotient = 3 */ 
remainder = x % y; /* if x= 7 and y = 2, remainder = 1 */ 


表 12-1 是 C 所 支持 的 算术 运算 符号 。 其 中 ， 乘 法 、 除 法 、 取 模 的 运算 优先 级 高 于 加 法 和 减法 。 
表 12-1 C 语 言 里 的 算术 运算 符 


示例 用 法 





12.3.4 算术 优先 级 
至 此 ， 在 继续 讨论 其 他 C 运 算 符 之 前 ， 我 们 先 回答 一 个 重要 问题 ， 如 下 诸 句 中 ，x 的 值 是 多 少 ? 
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X=2+3* 4; 

1. 优先 级 l 

首先 ， 该 运算 涉及 运算 过 程 的 顺序 问题 。 与 手工 计算 一 样 ， 表 达 式 的 推算 过 程 是 “有 顺序 的 ”， 
我 们 称 为 运算 符 的 “优先 级 ”(precedence) 。 例 如 ， 在 做 算术 运算 时 ， 我 们 认为 乘除 的 优先 级 高 于 
加 减 。C 语 言 的 运算 优先 级 规则 ， 与 我 们 的 小 学 算术 规则 是 一 致 的 。 所 以 ， 该 语句 的 计算 结果 是 ， 
x 等 于 14。 换 句 话 说 ， 该 表达 式 等 价 于 “2 + (3 *4)”。 

2. 关联 顺序 

但 是 ， 如 果 表 达 式 中 运算 符 的 优先 级 相等 ， 该 怎样 处 理 呢 ? 即 如 下 语句 的 结果 如 何 ? 

X=2+3-4+ 5; 

最 先 ， 被 处 理 的 运算 符 不 同 ， 则 结果 完全 不 同 。 表 达 式 “2 + 3-4 + 5” 的 结果 可 能 等 于 6， 也 
可 能 等 于 -4。 这 是 因为 ， 在 C 语 言 中 ， 加 东 和 减法 的 优先 级 相同 。 因 而 ， 我 们 还 必须 为 C 语 言 定 义 
一 个 推算 规则 。 尤 其 是 对 于 优先 级 相等 的 运算 符 ， 它 们 之 间 的 关联 性 (associativity) 决定 了 它们 
之 间 的 运算 顺序 。 例 如 ， 加 法 和 减法 之 间 ， 它 们 的 关联 关系 都 是 “ 自 左 向 右 ”， 所 以 “2 + 3-4+S” 
的 运算 过 程 等 价 于 “((2+3) -4) +5”。 

在 本 章 的 表 12-5 和 附录 D 的 表 D.4 中 ， 都 列举 了 C 运 算 符 的 优先 级 和 关联 性 规则 。 不 过 ， 我 们 不 
主张 你 去 死记 这 张 表 除非 你 希望 能 向 朋友 炫 泡 你 对 C 语 言 细节 的 熟悉 程度 )。 事 实 上 ， 你 只 需要 
知道 有 这 么 一 个 优先 级 规则 的 存在 ， 并 大 致 了 解 它们 背后 的 逻辑 即 可 。 当 你 不 确定 特定 运算 符 之 
闻 的 关系 时 ， 再 来 查阅 该 表 。 当 然 ， 还 有 一 种 最 可 靠 的 方法 一 一 使 用 括号 。 

3. 括号 

括号 不 受 任何 运算 规则 的 约束 ， 换 句 话说 ， 它 能 显 式 地 指示 哪些 运算 符 优先 ， 哪 些 运算 符 次 
之 。 在 通常 的 算术 运算 中 ， 我 们 总 是 从 最 里 的 圆 括 号 开始 计算 。 就 是 说 ， 如 果 我 们 希望 哪 部 分 表 
达 式 先 计算 ， 则 用 贺 括 号 将 这 个 子 表达 式 包 围 起 来 。 在 下 面 例子 中 ， 假 设 其 中 的 a、b、c、d 都 为 4。 
语句 

x-a*b*c*d/2; 

等 价 于 

x * (a * b) * ((c * d)/4); 

在 两 个 表达 式 中 ，x 的 值 都 为 20。 也 就 是 说 ， 不 管 是 依照 运算 符 优 先 级 规则 ， 还 是 通过 括号 显 
示 地 指明 运算 次 序 ， 程 序 总 是 先 匹配 括号 ， 从 里 向 外 ， 依 次 转移 至 外 层 。 在 没有 括号 的 情况 下 ， 
才 动 用 优先 级 规则 。 

试问 ， 如 果 a、b、c、d 都 为 4， 则 下 面 表达 式 结 果 如 何 ? 

x=a* (b+c)*d/ 4; 

另外 ， 插 号 使 得 代码 的 可 读 性 更 强 。 而 且 ， 大 多 数 人 不 一 定 能 记 住 C 语 言 里 的 优先 级 规则 。 所 
以 ， 对 于 复杂 的 表达 式 ， 我 们 通常 使 用 括号 ， 虽 然 设 有 这 些 括号 ， 代 码 同样 能 正常 工作 。 


12.3.5 ”位 运算 符 

现在 ,我 们 继续 介绍 C 语 言 运算 符 。C 语 言 中 有 一 组 “位 运算 符 ”， 它 们 的 作用 是 可 以 操作 数值 
的 任意 bit， 即 位 的 逻辑 操作 (如 AND、OR、NOT、XOR 等 )。 例 如 ， 在 C 语 言 中 ， 位 运算 符 “&” 
的 作用 等 价 于 LC-3 的 AND 指 令 ,“&” 运 算 符 的 操作 是 对 两 个 数 中 的 对 应 位 依次 相 “ 与 ”(AND)。 
类 似 ， 运 算 符 “I” 执 行 按 位 的 “或 ”操作 ， 运 算 符 “~” 执 行 按 位 的 “ 非 ” 操 作 (一 元 运算 符 ， 只 
需要 一 个 操作 数 )， 运 算 符 “^” 执 行 按 位 的 “ 异 或 ”操作 。 下 面 是 这 些 位 运算 在 十 六 位 数值 之 间 
的 运算 例子 。 


212 gR 





0x1234 | 0x5678 /* equals 0x567C */ 
0x1234 & 0x5678 /* equals 0x1230 */ 
0x1234 ^ 0x5678 /* equals Ox444C */ 
-0x1234 /* equals OxEDCB */ 


1234 & 5678 /* equals 1026 */ 


另外 ，C 语 言 的 位 运算 符 中 ， 还 包含 两 个 “位 移 ” 运 算 符 : 左 移 操 作 “<<” 和 右 移 操作 “>> 。 
这 两 个 运算 符 是 二 元 运算 符 ， 即 需要 两 个 操作 数 ， 一 是 被 位 移 数值 ， 二 是 位 移 位 数 。 左 移 操作 中 ， 
右边 移 空 位 补 0， 右 移 操 作 中 ， 左 边 移 空位 做 符号 扩展 。 表 达 式 的 值 是 运算 结果 ， 但 两 个 操作 数 本 
身 的 值 不 变 。 下 面 的 表达 式 是 十 六 进 制 整数 的 位 移 运算 表达 式 ， 


0x1234 << 3 /* equals Ox91A0 */ 
0x1234 »» 2 /* equals Ox048D */ 
1234 «« 3 /* equals 9872 */ 
1234 >> 2 /* equals 308 */ 
0x1234 << 5 /* equals 0x4680 (result is 16 bits) */ 
OxFEDC >> 3 /* equals OxFFDB (from sign-extension) */ 


下 面 例 子 是 包含 “位 运算 ”表达 式 的 C 语 句 。 注 意 ，C 的 位 运算 符 不 支持 对 浮 点 数 的 位 操作 。 
例如 ， 下 面 语 名 中 的 变量 f、g 和 h 都 是 整数 。 


h=f&g; /* if £- 7, g=8, h will equal 0 */ 
h-flg /* if f =7,9g= 8, h will equal 15 */ 
n=f <<1 /* iff = 7,g = 8, h will equal 14 */ 
h=g<<f /* if f=7,g=8, h will equal 1024 */ 
h= -f | ~g /* if f = 7, 9 = 8, h will equal -1 */ 


/* because h is a signed integer wf l 

思考 题 : 假设 在 特定 机 器 上 ， 整 数 变 量 x 的 长 度 是 16 位 ， 其 值 为 1。 语句 “x = x << 16;” 的 执 
行 结果 如 何 ? 理论 上 ， 将 x 移动 16 位 ( 即 它 本 身 的 数据 宽度 ) 之 后 ， 所 有 位 应 该 都 被 置 0， 即 x 的 值 
应 该 为 0。 但 为 了 保持 通用 性 (C 语 言 并 不 知道 特定 机 器 的 字 宽 度 是 多 少 )，C 语 言 规 定位 移 运 算 
(等 于 其 至 超过 数据 本 身 宽度 ) 的 结果 取决 于 具体 实现 。 也 就 是 说 ， 在 不 同 的 机 器 上 ， 移 动 相 同位 
数 之 后 ， 其 结果 可 能 为 0 也 可 能 不 为 0， 它 完全 取决 于 运行 系统 。 

表 12-2 列 出 了 所 有 位 运算 符 。 运 算 符 的 排列 以 优先 级 为 顺序 ， 其 中 “ 取 反 ”(NOT) 运算 符 的 优 
先 级 最 高 ， 然 后 是 “ 左 移 ” 和 “ 右 移 ”( 两 者 优先 级 相同 ) ， 随 后 是 “与 ”(AND)、“ 蜡 或 ”(XOR ) 
Tu "m" (OR) 运算 符 。 它 们 的 关联 顺序 都 是 自 左 向 右 。 表 12-5 是 运算 符 优 先 级 的 完整 列表 。 


表 12-2 语言 里 的 位 运算 符 





运算 符 符号 R 作 示例 
- ttz "BUx" (NOT) ~X 
<< EB Xx««y 
>> EB x>>y 
& tetz "55" (AND) x &y 
^ 按 位 “ 异 或 ”(XOR) x^y 
| 按 位 “或 ”(OR) xly 


12.3.5 关系 运算 符 


C 语 言 中 ， 关 系 运算 符 的 作用 是 测试 两 个 数值 之 间 的 关系 。 在 下 一 章 中 ， 我 们 将 在 “条 件 结构 
式 ” 中 使 用 它们 。 参 考 6.1.2 节 中 有 关系 统 分 解 过 程 中 的 条 件 结构 式 。 

相等 运算 符 “==” 是 一 个 C 关 系 运 算 符 。 该 运算 符 的 作用 是 测试 两 个 数值 是 否 相等。 如果 它们 
相等 ， 则 表达 式 值 为 1， 如 果 不 相等 ， 则 表达 式 值 为 9。 下 面 是 两 个 例子 : 


q = (312 == 83); /* q will equal 0 */ 
z = (x == y); /* z will equal 1 if x equals y */ 


第 二 个 例子 中 ， 赋 值 运 算 符 《=) 右边 的 表达 式 是 “x == y”， 它 只 有 两 个 可 选 结果 (1 或 0， 取 
， 决 于 x 和 y 是 否 相等 )。 值 得 一 提 的 是 ， 其 中 的 括号 不 是 必需 的 ， 因 为 “==” 运 算 符 的 优先 级 高 于 运 
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算 符 “=”。 但 是 ， 显然 有 了 这 个 括号 ， 表 达 式 的 意思 看 起 来 更 清晰 。 

与 “=” 运算 符 相反 ， 不 相等 运算 符 “!=”， 在 两 个 操作 数 不 相 等 时 ， 表 达 式 值 为 1。 另 外 ， 还 
有 其 他 关系 运算 符 ， 如 “大 于 ”(>)}、“ 小 于 ” (<) 等 等 ， 我 们 将 在 下 面 例子 中 予以 描述 。 假 设 变 
量 f、g 和 ?h 都 是 整数 ， 且 变量 f 的 值 为 ?7，8g 的 值 为 8。 


== g; /* Equal To operator. h will equal 0 */ 


h= f= 

h= f>g; /* Greater Than operator. h will equal 0 */ 
h-2ft-39; /* Not Equal To operator. h will equal 1 xf 
h= f <= g; /* Less Than Or Equal To. h will equal 1 */ 


下 面 的 这 个 例子 ， 表现 的 是 关系 运算 符 的 另 一 种 用 法 。 通 过 对 变量 的 关系 测试 ， 可 以 控制 程 
序 流程 的 改变 。 我 们 将 在 下 一 章 的 C 语 言 if 语 名 中 ， 详 细 介 绍 它 的 使 用 技巧 。 不 过 ，f 结 构 的 内 容 
已 不 是 什么 新 概念 ， 因 为 我 们 在 第 6 章 的 LC-3 编 程 中 ， 就 已 接触 过 这 个 特别 的 判断 结构 式 。 下 面 例 
子 的 意思 是 ， 当 变量 tankLevel (油箱 油 位 ) 等 于 0 时 ， 打 印 输出 一 个 消息 “油箱 空 了 ”。 


if (tankLevel == 0) 
printf("Warning: Tank Empty!!\n"); 


表 12-3 列 出 了 所 有 关系 运算 符 ， 以 及 每 个 运算 符 的 简单 例子 。 前 面 4 个 运算 符 的 优先 级 高 于 后 
” 面 两 个 。 所 有 运算 符 的 关联 顺序 都 是 自 左 向 右 。 


表 12-3 C 语 言 里 的 关系 运算 符 


运算 符 符号 — gw f 示 运算 符 名 示例 用 法 





12.8.7 PAGES 


C 语 言 的 逻辑 运算 符 ， 第 一 眼看 上 去 似乎 与 位 运算 符 很 相似 。 事 实 上 ， 编 程 新 手 经 常会 将 两 者 
混淆 。 为 此 ， 我 们 先 介 绍 一 下 逻辑 值 “ 真 ”(true) 和 “ 假 ”(false) 的 概念 。 在 C 语 言 的 逻辑 运算 
概念 中 ， 非 零 值 ( 即 其 值 不 为 零 的 任何 数值 ) 被 认为 是 逻辑 真 ， 数 值 零 则 被 认为 是 逻辑 假 。 这 个 
定义 非常 重要 ， 因 为 后 面 的 内 容 中 ， 我 们 会 反复 涉及 此 概念 。 

C 语 言 支持 三 种 逻辑 运算 符 : &&,. Un! 。 运 算 符 “&& ”表示 两 个 操作 数 的 逻辑 与 (AND), 
如 果 两 个 操作 数 都 为 逻辑 真 (或 非 零 ) ， 则 逻辑 表达 式 值 为 1 ( 即 逻 辑 真 ) ， 否则 ， 逻 辑 表达 式 值 
为 0。 例如， 表达 式 “3 && 4” 的 结果 为 1， 而 “3 && 0” 结 果 为 0。 运 算 符 “I” 代 表 逻 辑 或 (OR ) 。 
例如 ， 如 果 x 或 y 有 一 个 值 为 非 零 ， 则 表达 式 “x o! y” 值 为 1。 因 此 ， 表 示 式 “3 14” 的 结果 为 1， 
表达 式 “3 ll 0” 结 果 也 为 1。 运 算 符 “! ” 表示 对 操作 数 的 值 远 辑 取 反 。 因此 ， 当 且 仅 当 数 值 z 为 0 
时 ，!x 才 为 1; 否则， 结果 为 0。 

那么 , “逻辑 运算 符 ” 有 什么 用 呢 ? 在 程序 中 ， 它 可 被 用 于 构建 “逻辑 条 件 "。 例 如 ， 我 们 可 

以 结合 关系 运算 符 和 逻辑 运算 符 ， 判 断 变 量 值 是 否 落 入 特定 范围 内 。 比 如 对 变量 x， 判 断 其 数值 是 
否 在 10~20 之 间 (包括 10 和 20) ， 则 表达 式 的 形式 如 下 : 

(10 <= x) && (x <= 20) 

再 如 ， 判 断 字符 变量 c 是 否 是 一 个 合法 字母 ( 即 是 否 在 字母 表 范 围 内 ) ， 表 达 式 如 下 : 

(('a' <= c) && (c <= 'z')) |] (('A' <= c) && (c <= '2')) 

下 面 是 罗 辑 运算 符 的 各 种 示例 ， 其 中 包含 前 面 介绍 过 的 “位 运算 符 "。 之 所 以 将 它们 列 在 一 起 ， 
EH T HEAR 它们 之 间 的 差异 。 与 之 前 的 例子 相同 ， 变 量 f、g 和 h 都 是 整数 类 型 ， 变 量 f 等 于 7，8g 等 于 8。 


=f &g; /* bitwise operator: h will equal O */ 
h = f &k g; /* logical operator: h will equal 1 */ 
h-fj|g /* bitwise operator: h will equal 15 */ 
h= f|] g; /* loaical operator: h will equal 1 */ 
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h= -£ | ~g; /* bitwise operator: h will equal -1 */ 
h = !f && !g; /* logical operator: h will equal 0 +/ 
h = 29 |} -52; /* logical operator: h will equal 1 */ 


表 12-4 列 出 了 C 语 言 中 的 逻辑 运算 及 其 符号 。 逻 辑 非 运算 符 的 优先 级 最 高 ， 然 后 是 逻辑 与 ， 罗 
辑 或 。 如 果 想 要 知道 运算 符 优先 级 的 完整 列表 ， 可 以 参看 表 12-5。 


X12-4 C 语 言 中 的 逻辑 运算 符 


运算 符 符 号 HB 4 示 A 
! EHHE Ix 
&& E85 x && y 
E 逻辑 或 xlly 


32-5 运算 符 优先 级 (从 高 到 低 排 列 ， 括 号 内 为 运算 符 的 说 明 ) 


优先 级 关联 顺序 运 算 m" 
1 (最 高 ) 自 左 向 右 O (函数 调用 ) 0 (数组 索引 ) ,-> 
2 自 右 向 左 ”+ 一 ~ (后缀 版 ) 
3 自 右 向 左 ++ 一 ~ 前缀 版 ) 
4 自 右 向 左 * (间接 引用 ) & (Wibi) + (一 元 ) 一 (一 元 ) ~ ! sizeof 
5 自 右 向 左 (type) (类 型 转换 ) 
6 自 左 向 右 * (R) /% 
7 自 左 向 右 + (m) - ( 减 ) 
8 自 左 向 右 << >> 
自 左 向 在 < > <= >= 
10 自 左 向 右 == != 
11 自 左 向 右 & 
12 自 左 向 右 ^ 
13 自 左 向 右 ! 
14 自 左 向 右 && 
15 自 左 向 右 I 
16 自 左 向 右 ?: (条 件 表达 式 ) 
17 最 低 自 右 向 左 =+= -=*+= 等 


12.3.8 递增 /递减 运算 符 


变量 的 增 、 减 操作 非常 频繁 ，C 语 言 的 设计 者 为 此 设计 了 专门 的 运算 符 。 运 算 符 “++” 代 表 变 
量 数值 的 “递增 ” (increment) ， 运 算 符 “-- ”代表 变量 数值 的 “递减 ”(decrement)。 例 如 ， 表 达 
式 “x++” 表 示 将 整 型 变量 x 的 值 递增 1 ， 表 达 式 “x-- ”表示 将 整 型 变量 x 的 值 递减 1。 值 得 注意 的 
是 ， 它 们 都 是 对 变量 自身 值 的 改变 。 因 此 ， 表 达 式 “x++” 和 “x = x + 1” 的 效果 是 一 样 的 。 

运算 符 “++” 和 和 “一”， 可 以 放 在 变量 的 任意 一 边 ( 左 或 右 )。 但 是 ， 表 达 式 “++x” 和 
“x++” 之 间 存 在 细微 差别 。 在 一 个 复合 表达 式 中 ， 如 果 包 含 “x++”， 则 “x++” 代 表 的 是 x 递增 之 
前 的 值 ， 相 反 ， 如 果 是 “++x” 则 代表 的 是 x 递增 之 后 的 值 。 我 们 称 运算 “++” 出 现在 变量 名 前 面 
Jj "ATA" (prefix) 形式 ， 而 出 现在 变量 名 后 面 为 “后 级 ”(postfix) ER. MAERA "tg" 
(preincrement) 或 “ 先 减 ”"， 后 级 形式 则 称 为 “后 增 ” (postincrement) x; "o", 

下 面 ， 我 们 看 一 对 例子 : 


X = 4; 
y = X++; 


此 处 ， 虽 然 变量 x 的 值 递 增 了 ， 但 赋 给 变量 y 的 还 是 x 的 原 值 〈 即 表达 式 x++ 的 值 等 于 原 x 的 值 ) 。 
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代码 执行 之 后 ， 变 量 y 为 4，x 为 5。 
再 看 ， 与 前 面 类 似 的 两 行 代 码 : 


X= 4; 
y = ++X; 


在 此 ， 变 量 x 的 值 也 被 递增 。 但 是 ， 在 这 个 代码 中 ， 表 达 式 “++x” 代 表 的 是 x 递增 之 后 的 值 。 
执行 结果 是 ，x 和 y 的 值 都 为 5。 

前 缀 形式 和 后 缀 形式 的 微小 区 别 ， 到 现在 为 止 理解 起 来 应 该 不 是 太 难 。 本 书 中 的 大 多 数 例子 里 ， 
前 缀 形式 运算 符 和 后 缀 形式 运算 符 都 是 可 以 替换 的 。 在 附录 D.5.6 中 ， 有 关于 这 个 区 别 的 更 详细 描述 。 


12.8.9 运算 符 混合 表达 式 


至 此 ， 我 们 所 列举 的 表达 式 中 都 最 多 只 包含 一 个 或 两 个 运算 符 。 在 实际 代码 中 ， 表 达 式 可 能 
包含 多 个 运算 符 。 多 种 运算 符 和 操作 数组 合 在 一 起 ， 可 以 构建 非常 复杂 的 表达 式 。 如 下 所 示 是 一 
个 混合 多 种 运算 符 的 复杂 表达 式 : 

Y=x&z+3||9-w%6; 

推算 该 语句 运算 结果 的 第 一 步 ， 是 检查 运算 符 的 操作 顺序。 参见 表 12.5 中 的 C 运 算 符 (其 中 有 
一 些 我 们 目前 还 未 介绍 的 运算 符 ) 及 其 优先 级 。 参 照 优 先 级 规则 ， 该 语句 等 价 为 如 下 语句 : 

Y= (x& (z+ 3)) || (9 - (wt 6); 

再 如 ， 下 面 的 表达 式 中 ， 如 果 变 量 age 的 值 在 18 到 25 之 间 ， 则 表达 式 的 结果 为 1， 否 则 为 0。 注 
意 ， 其 中 的 括号 不 是 必需 的 ， 但 有 了 它们 ， 可 使 表达 式 显 得 更 易于 阅读 ， 代 码 更 易于 理解 。 


(18 «- age) && (age <= 25) 


12.4 基于 运算 符 的 问题 求解 


至 此 ， 我 们 已 经 学 习 了 足够 多 的 C 运 算 符 。 下 面 ， 我 们 将 学 习 怎 样 使 用 它们 去 求解 简单 问题 。 
现在 ,我 们 将 编写 一 个 程序 ， 计 算 在 特定 传输 速率 (每 秒 字 节 数 ) 下 ， 网 络 传输 一 定数 量 的 字 贡 
所 需要 的 时 间 。 问 题 的 难度 主要 是 怎样 用 “小 时 /分 钟 / 秒 ” 的 形式 显示 传输 时 间 。 

基于 第 6 章 介绍 的 问题 分 解 技术 ， 我 们 将 从 程序 描述 开始 ， 然 后 将 其 分 解 为 各 个 子 问题 ， 并 分 
别 采 用 顺序 、 判 断 和 循环 等 结构 式 描 述 它们 ， 最 后 为 每 个 结构 式 或 模块 编写 C 代 码 。 我 们 称 这 种 技 
术 为 “ 自 项 向 下 分 解 ”"， 因 为 我 们 从 粗略 的 算法 描述 开始 ， 然 后 将 各 步骤 尽力 细 化 分 解 ， 直 到 它 可 
以 被 编程 实现 。 对 于 有 经 验 的 程序 员 ， 依 靠 他 们 对 底层 系统 的 理解 ， 能 够 更 准确 地 决策 问题 应 该 
怎样 分 解 。 同 时 ， 为 了 使 用 程序 方法 解决 问题 ， 他 还 必须 熟悉 了 解 编程 系统 的 基本 要 素 。 到 目前 
为 止 ， 这 些 基本 要 素 就 是 三 种 变量 类 型 ， 以 及 相关 的 操作 运算 符 。 

在 后 面 的 章节 里 ， 我 们 还 将 陆续 介绍 几 个 问题 求解 例子 ， 以 阐述 自 顶 向 下 分 解 过 程 的 方法 ， 
帮助 程序 员 更 好 地 理解 问题 求解 的 过 程 。 

第 一 件 事情 ( 即 第 0 步 )， 就 是 思考 怎样 表示 数据 对 象 。 基 于 现 有 知识 ， 我 们 能 够 选择 的 就 是 
从 C 语 言 的 三 种 基本 类 型 中 ， 为 数据 对 象 选 择 数据 类 型 : 整 型 、 字 符 型 或 浮 点 型 。 针 对 网 络 传输 时 
间 问 题 ， 可 以 选用 浮 点 数 或 整数 来 表示 内 部 计算 量 。 但 由 于 最 终 要 显示 的 时 间 格 式 是 “小 时 /分 钟 / 
秒 ” 的 形式 ， 其 中 的 小 数 部 分 在 此 是 不 需要 的 。 例 如 ， 传 输 时 间 等 于 “10.1 小 时 12.7 分 9.3 秒 "， 是 
不 合适 的 ， 正 确 的 表示 应 该 是 “10 小 时 18 分 51 秒 ”。 因 此 ， 我 们 决定 选用 整 型 而 不 是 浮 点 数 类 型 
(的 确 ， 这 会 产生 四 售 五 人 的 问题 ， 但 针对 该 问题 ， 我 们 可 以 将 它们 忽略 ) 。 

在 确定 数据 类 型 之 后 ， 我 们 开始 逐步 细 化 、 分 解 问 题 。 图 12-3 是 该 问题 的 分 解 示 意图 。 图 中 
的 第 1 步 是 勾画 问题 的 基本 组 成 ， 即 包括 读 取 输 入 、 计 算 、 输 出 结果 等 三 个 阶段 。 其 中 ， 第 一 阶段 
是 获取 数据 传输 总 量 〈 字 节 单位 ) 和 网 络 传输 速率 ( 字 节 每 秒 单位 )， 第 二 阶段 是 执行 相关 计算 ， 
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第 三 阶段 是 输出 特定 格式 的 结果 。 

第 1 步 的 描述 ， 其 细致 程度 还 不 足以 将 它们 直接 翻译 为 C 代 码 ， 所 以 我 们 还 需要 在 第 2 步 对 它 进 一 
步 地 细 化 。 我 们 注意 到 ， 其 中 的 计算 阶段 还 可 以 进一步 分 解 。 即 可 以 先 计算 总 秒 数 (基于 用 户 输入 ， 
很 容易 完成 该 计算 ) ， 然 后 调用 一 个 转换 子 程序 ， 将 总 时 间 CEP) 转换 为 “小 时 /分 钟 / 秒 ” 的 格式 。 

但 是 对 于 C 语 言 来 说 ， 第 2 步 的 部 分 描述 还 不 够 具体 。 所 以 。 我 们 决定 对 其 进行 第 3 步 细 化 。 在 
第 2 步 中 ， 大 多 数 内容 已 可 以 直接 翻译 为 C 代 码 了 ， 只 是 “将 秒 转换 为 小 时 /分 钟 / 秒 ” 这 个 过 程 还 需 
细 化 。 所 以 ， 第 3 步 的 任务 是 将 该 子 过 程 进一步 细 化 为 三 个 更 小 的 子 阶段 。 首 先 ， 我 们 计算 总 秒 数 
对 应 的 小 时 数 ， 然 后 再 计算 剩余 秒 数 对 应 的 分 钟 数 ， 最 后 是 剩余 秒 数 。 

现在 ， 如 图 12-3 所 示 ， 整 个 问题 在 经 历 了 三 步 细 化 之 后 ,已 足够 简单 ， 可 以 将 它 翻 译 成 C 代 码 


了 。 最 后 的 C 程 序 如 图 12-4 所 示 。 


FRI 步骤 2 mg 





计算 传输 时 间 ， 
单位 为 秒 






图 12-3 计算 网 络 传输 时 间 问 题 的 细 化 过 程 


#include «stdio.h» 
int main() 


int amount; /* The number of bytes to be transferred 
int rate; /* The average network transfer rate 


int time; /* The time, in seconds, for the transfer 


int hours; /* The number of hours for the transfer 
int minutes;  /* The number of mins for the transfer 
int seconds;  /* The number of secs for the transfer 


图 12-4 简单 的 网 络 速率 计算 C 程 序 
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/* Get input: number of bytes and network transfer rate */ 
printf("How many bytes of data to be transferred?  "); 
Scanf("$d", &amount); 


printf("What is the transfer rate (in bytes/sec)? "); 
Scanf("td", &rate); 


/* Calculate total time in seconds */ 
time = amount / rate; 


/* Convert time into hours, minutes, seconds */ 
hours - time / 3600; /* 3600 seconds in an hour */ 
minutes = (time % 3600) / 60; /* 60 seconds in a minute */ 
seconds = ((time $ 3600) * 60); /* remainder is seconds */ 


/* Output results */ 
printf("Time : $dh tdm $&dsWn", hours, minutes, seconds); 





图 12-4 简单 的 网 络 速率 计算 C 程 序 (HX) 


12.5 编译 器 处 理 

至 此 ， 我 们 已 介绍 了 本 书 将 涉及 的 所 有 C 基 本 类 型 和 运算 符 。 在 介绍 了 C 的 第 一 组 概念 之 后 ， 
我 们 计划 从 编译 器 的 角度 ， 来 理解 一 下 这 些 概 念 。 换 名 话说， 就 是 思考 “编译 器 是 怎样 翻译 C 代 码 
中 的 变量 和 运算 符 的 ? “。 编 译 器 在 完成 翻译 工作 的 时 候 ， 需 要 借助 于 两 个 机 制 。 一 是 符号 表 。 编 
译 器 在 编译 过 程 中 ,将 与 变量 相关 的 信息 记录 在 “符号 表 ”(symbol table) 中 ， 二 是 内 存 的 系统 分 
配 。 即 根据 变量 特性 分 配 内 存 。 编 译 器 将 从 整个 系统 层面 ， 为 不 同类 别 的 对 象 划分 不 同 的 内 存 区 
域 。 在 本 节 中 ， 我 们 将 仔细 研究 这 两 个 基本 机 制 。 
12.5.1 符号 表 

在 第 7 章 里 ， 我 们 学 习 了 汇编 器 基于 “符号 表 ” 记 录 “ 标 号 ”(label) 的 工作 原理 。 与 汇编 器 
一 样 ，C 编 译 器 也 使 用 符号 表 来 记录 程序 中 遇 到 的 变量 。 编 译 器 在 扫描 程序 代码 的 过 程 中 ， 每 遇 到 
一 个 变量 声明 语句 ， 就 在 符号 表 中 为 该 变量 创建 一 个 新 表 项 。 表 项 结构 中 ， 将 包含 很 多 字段 信息 ， 
这 些 字 段 信息 与 变量 的 存储 空间 管理 及 变量 操作 代码 生成 等 都 有 关 。 这 些 字 段 包 括 ， 名字、 类 型 、 
已 分 配 的 内 存 地 址 、 变 量 声明 域 或 作用 域 等 信息 。 

图 12-5 是 对 应 于 图 12-4 的 程序 变量 符号 表 。 由 于 程序 中 包含 了 6 个 变量 声明 ， 所 以 编译 器 为 之 
生成 了 有 6 个 表 项 的 符号 表 。 注 意 ， 编 译 器 采用 的 是 偏 移 方式 ， 记 录 变 量 在 内 存 中 的 位 置 。 也 就 是 
说 ， 它 记录 的 是 变 基 在 已 分 配 的 内 存 区 域 中 的 相对 位 置 ， 且 大 多 数 偏 移 值 都 是 负数 。 
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图 12-5 编译 器 的 符号 表 (对 应 图 12-4 的 程序 ) 














218 £12* 





这 个 函数 有 69 个 局 部 变量 。 帧 指针 R5 指 向 第 一 个 局 部 变量 


12.5.2 变量 的 空间 分 配 


在 C 语 言 中 ， 存 放 变量 内 容 的 内 存 空间 (变量 的 分 配 空间 ) 有 两 种 区 段 (region) ， 全 局 数据 自 
(global data section) F447 ® (run-time stack)。 全 局 数据 段 是 内 存 中 存放 全 局 变量 的 区 段 ， 
即 所 有 静态 类 变量 所 在 的 地 方 (参见 12.6 节 ) ， 运 行 时 栈 则 是 局 部 变量 (默认 情况 下 为 自动 类 变量 ) 
所 在 的 地 方 。 

符号 表 中 的 偏 移 字 段 (offset) ， 提 供 了 有 关 变 量 在 内 存 中 更 精确 的 位 置信 息 ， 它 代表 的 是 变量 
存储 地 址 距离 内 存 段 基地 址 的 偏 移 (或 距离 )。 

例如 ， 如 果 全 局 变量 earth 距 离 全 局 数据 段 起 始 地 址 (0x5000) 的 偏 移 量 值 为 4， 则 变量 earth 的 
实际 位 置 就 是 地 址 0x5004。 在 编译 器 生成 的 机 器 代码 中 ，R4 是 一 个 专用 寄存 器 ， 它 存放 的 是 全 局 
数据 段 的 基地 址 (或 起 始 地 址 ) ， 所 以 R4 可 以 被 看 做 是 一 全 全 局 指针 。 如 果 要 将 变量 earth 的 内 容 读 
人 寄存 器 R3， 则 LC-3 指 令 如 下 : 

LDR R3, R4, #4 ! 

与 之 前 的 情况 相反 ， 如 果 earth 是 一 个 局 部 变量 (比如 在 main 函 数 体 内 被 声明 ) ， 情 况 将 变 得 有 
些 复杂 。 一 个 函数 中 所 有 的 局 部 变量 都 存放 在 一 个 被 称 做 “活动 记录 ”(activation record) 或 “ 堆 
AM” (stack frame) 的 内 存 模板 (memory template) 中 。 在 此 ， 我 们 只 介绍 该 活动 记录 的 结构 ， 
而 对 为 什么 是 这 样 ， 暂 不 展开 介绍 (其 中 道理 参见 第 14 章 ) 。 所 谓 “ 话 动 记录 "， 是 一 段 连续 的 内 
存 空间 ， 它 包含 了 当前 函数 中 所 有 的 局 部 变量 。 每 个 国 
数 有 自己 的 活动 记录 【准确 地 说 ， 应 该 是 每 个 被 调用 的 | 
函数 ， 都 有 一 个 自己 的 活动 记录 )。 当 我 们 调用 一 个 函数 位 置 x0000 
时 ， 该 函数 活动 记录 的 最 大 地 址 将 存放 在 寄存 器 R5 中 。 
因此 ，RS5 又 被 称 做 “ 帧 指针 ” (frame pointer)。 图 12-6 
所 示 是 图 12-4 中 main 函 数 的 活动 记录 。 注 意 ， 活 动 记录 
中 ， 变 量 的 排放 顺序 与 它们 在 程序 中 的 声明 顺序 是 相反 
的 。 例 如 ， 变 量 amount 在 程序 中 是 最 先 被 声明 的 变量 ， 

而 它 也 是 距离 “ 帧 指针 ”R5 最 近 的 变量 。 

当局 部 变量 在 程序 中 被 引用 时 ， 编 译 器 将 参照 符号 Rs — 

表 ， 按 照 该 变量 对 应 表 项 的 信息 ， 生 成 合适 的 机 器 代码 。 

这 主要 是 因为 ， 表 项 中 的 偏 移 宇 段 能 够 告诉 编译 器 ， 该 

变量 在 活动 记录 中 的 相对 位 置 。 例 如 ， 访 问 变量 seconds， 位 置 xFFFF 
编译 器 将 生成 如 下 的 指令 : 

LDR R0, R5, #-5 

我 们 可 以 预见 如 下 的 场景 在 C 程 序 中 ， 当 我 们 调用 。 图 12-6 LC-3 内 存 中 的 一 个 活动 记录 
一 个 函数 时 (在 C 语 言 中 ,“ 子 程序 ”和 “函数 ”是 同一 个 概念 ) ， 该 函数 的 活动 记录 被 “ 压 人 ”(push) 
当前 栈 。 同 时 ，Rs 内 容 被 调整 ， 指 向 当前 栈 巴 〈 即 记录 的 基地 址 ) 。 这 意味 着 ， 我 们 可 以 通过 栈 指针 





日 ”原文 此 处 为 5， 应 该 是 个 明显 的 笔 误 。 一 一 译 者 注 . 

恕 ”在 本 书 的 所 有 例子 中 ， 变 量 都 对 应 于 一 个 内 存 地 址 。 但 在 真实 的 编译 器 中 ， 出 于 优化 目的 ， 通 常会 将 一 些 
变量 分 配 到 寄存 器 空间 中 。 这 是 因为 访问 寄存 器 所 花 的 时 间 比 访问 内 存 时 要 少 得 多 ， 所 以 会 将 经 常 被 访问 
的 变量 内 容 存放 在 寄存 器 里 ， 从 而 加 速 程序 的 执行 速度 。 
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访问 函数 内 的 局 部 变量 。 当 该 函数 结束 ， 即 将 把 控制 权 交 还 给 调用 者 时 ,活动 记录 将 被 “弹出 ”(pop) 


当前 栈 。 同 样 ， 指 针 R5 的 内 容 也 将 被 修改 ， 指 
向 调用 者 活动 记录 所 在 位 置 。 整 个 过 程 中 ， 寄 存 
器 R6 始 终 指 向 运行 时 栈 的 顶部， 我 们 称 R6 为 
“ 栈 指针 ”"。 有 关 阅 述 ， 参 见 第 14 章 。 

图 12-7 是 程序 运行 时 LC-3 的 内 存 布局 结构 。 
几乎 所 有 的 UNIX 类 操作 系统 ， 都 采用 这 种 内 存 
空间 结构 。 其 中 ， 程 序 代码 占用 一 个 区 域 ， 类 
似 地 ,“ 运 行 时 栈 ” 和 “全 局 数据 段 ” 也 有 各 自 
的 区 域 。 另 外 ， 还 有 一 个 “ 堆 空 间 ”(heap) 
(我 们 将 在 第 19 章 讨论 它 )， 它 存放 的 是 动态 分 
配 的 数据 。 栈 和 堆 的 大 小 在 程序 运行 时 是 可 以 
改变 的 。 例 如 ， 当 一 个 函数 调用 另 一 个 函数 时 ， 


栈 空 间 会 因为 新 的 活动 记录 的 入 栈 而 变 大 (从 ， 


大 地 址 向 地 址 x0000 方 向 增长 ) 。 与 之 相反 ， 堆 
的 增长 方向 是 地 址 0xFFFF。 正 是 因为 栈 的 增长 
方向 是 颠倒 的 〈x0000 方 向 ) ， 所 以 其 中 的 活动 
记录 结构 也 是 反 向 的 ， 即 R5 指 向 第 一 个 局 部 变 
量 ，R5-1 指 向 下 一 个 ， 再 之 后 是 R5-2 (参见 
12.5.1 节 中 介绍 符号 表 结构 时 提出 的 问题 )。 

在 执行 过 程 中 ， 寄 存 器 PC 指向 程序 中 当前 执 
行 代码 ，R4 指 向 全 局 数据 段 的 起 始 ，R5 指 向 栈 空 
间 内 部 ，R6 则 指向 栈 空间 顶部 。 此 外 ， 还 存在 一 
些 专 用 内 存 区 域 。 图 12-7 中 的 系统 空间 (system 
space) ， 是 为 操作 系统 预 留 的 ， 其 中 包括 TRAP 服 


x0000 





-PC 


R4 
全 局 数据 段 
堆 空间 (用 于 动态 分 配 的 内 存 空 间 ) 


- R6 栈 指针 
- R5 帖 指针 


xFFFF 


图 12-7 LC-3 程 序 执行 过 程 中 的 内 存 结构 图 


务 程序 、 矢 量 表 、IO 寄 存 器 空间 、 系 统 引 导 代 码 等 内 容 。 


12.5.3 完整 的 例子 


前 面 介绍 了 有 关 LC-3 编 译 器 的 系统 内 存 空间 布局 ， 以 及 局 部 变量 的 活动 记录 结构 的 处 理 方法 。 
下 面 ， 我 们 将 以 一 个 完整 的 C 程 序 为 例 ， 介 绍 它 的 编译 过 程 ， 以 及 翻译 之 后 的 LC-3 代 码 。 

图 12-8 所 示 是 一 个 执行 了 简单 计算 并 将 结果 打印 输出 的 C 程 序 。 该 程序 包含 1 个 全 局 变量 
inGlobal， 在 main 国 数 内 ， 包 含 3 个 局 部 变量 inLocal、outLocalA 和 outLocalB 。 


/* Include the standard I/O header file */ 


Binclude <stdio.h> 


int inGlobal; 


int main() 


int inLocal; 


/* inGlobal is a global variable because */ 
/* it is declared outside of all blocks */ 


/* inLocal, outLocalA, outLocalB are all */ 


int' outLocalA; /* local to main */ 


* int outLocalB; 





图 12-8 一 个 执行 简单 操作 的 C 程 序 
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/* Initialize */ 
inLocal = 5; 
inGlobal = 3; 


/* Perform calculations */ 
outLocalA = inLocal & ~inGlobal; 
outLocalB = (inLocal + inGlobal) - (inLocal - inGlobal); 


/* Print out results */ 
printf("outLocalA - $d,outLocalB-$&dWn",outLocalA,outLocalB); 





图 12-8 一 个 执行 简单 操作 的 C 程 序 (535) 


程序 的 开始 ,是 对 ipLocal 和 inGlobal 的 初始 化 : 之 后 ， 执 行 变 量 inLocal 和 inGlobal 之 间 的 运算 ， 
并 将 计算 结果 分 别 放 入 变量 outLocalA 和 outLocalB， 最 后 ， 调 用 标准 库 提 供 的 printf 函 数 ， 将 计算 
结果 打印 输出 〈 即 outLocalA 和 outLocalB 的 值 ) 。 注 意 ， 由 于 我 们 在 此 使 用 了 printf 函 数 ， 因 此 必须 
在 程序 开始 时 包含 (include) 标准 MO 库 的 头 文件 一 stdio.h。 

在 分 析 代 码 时 ，LC-3 C 编 译 器 将 全 局 数据 段 中 的 第 一 个 位 置 ( 即 偏 移 量 为 0 的 空间 ) 分 配给 变 
量 inGlobal。 当 分 析 过 程 进入 main 函 数 体内 部 时 ， 编 译 器 将 main 沙 数 活 动 记录 区 的 偏 移 0 的 位 置 分 
配给 局 部 变量 inLocalA， 将 偏 移 一 1 的 位 置 分 配给 outLocalA ， 将 偏 移 ~2 的 位 置 分 配给 outLocalB。 
图 12-9 所 示 是 编译 器 的 符号 表 和 main 函 数 活 动 记录 区 的 一 个 快照 。 


位 置 x0000 


outLocalB 
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mean |] 9 [9| - |, 
eene | sme | 2 | mes] ——] 
a) 符 导 表 b) 函数 的 活动 记录 


| 图 12-9 图 12-8 所 示 程 序 的 编译 器 符号 表 和 main 函 数 的 活动 记录 
图 12-10 所 示 是 LC-3 C 编 译 器 产生 的 汇编 代码 。 该 程序 从 标识 main 处 开始 执行 。 


, #0 


, #5 ; inLocal is at offset 0 
, #0 ; inLocal = 5; 


, #0 
, 433 ; inGlobal is at offset 0, in globais 





图 12-10 对 应 图 12-8 所 示 C 程 序 的 LC-3 代 码 
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inGlobal - 3; 


; get value of inLocal 

; get value of inGlobal 

; -inGlobal 

; calculate inLocal & -inGlobal 

; OutLocalA = inLocal & -inGlobal; 
outLocalA is at offset -1 


; get value of inLocal 
; get value of inGlobal 
calculate inLocal + inGlobal 


; get value of inLocal 
get value of inGlobal 


calculate -inGlobal 

calculate inLocal - inGlobal 

calculate -(inLocal - inGlobal) 

(inLocal « inGlobal) - (inLocal - inGlobal) 


outLocalB s ... 
outLocalB is at offset -2 


«code for calling the function printf» 





图 12-10 对 应 图 12-8 所 示 C 程 序 的 LC-3 代 码 ( 续 ) 


12.6 补充 话题 


这 是 本 章 的 最 后 一 节 ， 将 对 变量 和 运算 符 做 一 些 补充 论 述 。 这 些 内 容 只 是 本 章 之 前 内 容 的 延 
伸 ， 是 有 关 C 语 言 的 琐碎 细节 。 它 们 与 本 书 其 他 内 容 没 有 直接 关联 ， 只 是 对 C 语 言 知 识 的 一 个 涵盖 ， 
如 果 你 对 C 语 言 的 变量 和 运算 符 确 有 兴趣 ， 那 么 接着 读 吧 ! 


12.6.1 三 种 基本 类 型 的 变种 


在 C 语 言 中 ， 程 序 员 可 以 定制 三 种 基本 类 型 int、char、double 的 大 小 。 例 如 ， 在 int 前 面 加 上 前 
毕 long 和 short， 将 在 int 默 认 大 小 的 基础 上 扩大 和 缩小 其 大 小 。 如 “long int” 表 示 的 bit 宽 度 是 常规 
int 的 两 倍 。 基 于 这 种 机 制 ， 我 们 就 可 以 在 C 程 序 中 表示 更 大 范围 的 整数 。 同 样 ， double 也 可 以 加 上 
前 级 long， 它 将 扩展 浮 点 类 型 的 表示 范围 和 精度 (需要 系统 支持 )。 

修饰 词 short 的 作用 则 是 减 小 变量 类 型 的 默认 大 小 。 我 们 可 以 借用 它 节省 内 存 空间 。 下 面 是 使 
用 修饰 符 long 和 short 声 明 变 量 的 例子 : 


long double particlesInUniverse; 
long int worldPopulation; 
short int ageOfStudent; 


C 语 言 的 三 种 基本 类 型 与 底层 指令 集结 构 (SA) 密切 相关 。 因 此 ， 许 多 编译 器 只 在 底层 指令 
集结 构 能 支持 的 情况 下 ， 才 能 真正 支持 修饰 词 Jong 和 short。 也 就 是 说 ， 如 果 底 层 指令 集结 构 不 支持 
长 整数 类 型 ， 即 使 将 变量 声明 为 “long int”， 它 实际 上 和 int 没 有 区 别 。 附 录 D.3.2 是 有 关 1long 和 
short 更 多 的 例子 和 说 明 。 

int 类 型 的 又 一 变种 是 “无 符号 整数 ”(unsigned integer) ， 它 的 修饰 词 是 “unsigned”。 所 谓 
“无 符号 整数 ”"， 就 是 在 所 有 bit 中 不 存在 符号 位 ， 能 表达 的 数 也 都 是 非 负 整数 ( 正 数 和 0)。 例 如 ， 
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在 LC-3 中 ， 整 数 的 宽度 是 16-bit， 则 无 符号 整数 的 表示 范围 为 0~65535。 当 处 理 一 些 自然 界 的 对 象 
时 ， 如 果 其 值 不 为 负 ， 则 可 以 使 用 无 符号 整数 类 型 。 下 面 是 无 符号 整数 的 例子 : 


unsigned int numberOfDays; 
unsigned int populationSize; 


以 下 是 三 种 基本 类 型 的 各 种 变种 形式 ， 

long int ounces; 

short int gallons; 

long double veryVeryLargeNumber - 4.12936E361; 
unsigned int sizeOfClass = 900; 


float oType = 9.24; 
float tonsOfGrain = 2.998E8; 


12.6.2 文字 常量 、 常 量 和 符号 值 


在 C 语 言 中 ， 若 一 个 变量 的 前 组 为 const， 就 表示 该 变量 内 容 是 “常量 ”"。 所 谓 常量 ， 是 指 其 内 
容 在 程序 执行 过 程 中 不 可 修改 。 例 如 ， 计 算 贺 的 面积 和 周 长 时 ， 需 要 一 个 值 为 3.14159 的 浮 点 常量 。 
图 12-11 所 示 就 是 这 样 一 个 程序 。 

在 这 个 例子 中 ， 我 们 可 以 学 习 和 区 分 C 语 言 的 三 种 常量 。 一 是 “文字 常量 ”"， 代 表 代 码 中 那些 
没有 名 字 的 数值 。 如 本 例 中 的 数值 2 和 3.14159， 都 属于 文字 常量 。 注 意 ，C 语 言 中 的 十 六 进 制 文字 
常量 必需 前 缀 0x (如 0x1DB)， 而 ASCII 文 字 需 用 单 引 号 包围 (如 “R”， 它 代表 的 是 字母 R 的 ASCII 
值 )， 浮 点 文字 的 表示 方式 则 参见 12.2.1 节 ， 二 是 前 缀 修饰 符 const 的 变量 (有 名 字 ) 方式 ， 如 程序 
中 的 常量 变量 pi， 三 是 预 处 理 指令 #define 方 式 , 例如 符号 数值 RADIUS。 所 有 这 三 种 类 型 的 常量 值 ， 
在 整个 程序 生命 期 内 都 不 会 改变 。 

#include <stdio.h> 


#define RADIUS 15.0 /* This value is in centimeters */ 
int main() 

const double pi - 3.14159; 

double area; 


double circumference; 


/* Calculations */ 
area - pi * RADIUS * RADIUS; /* area = pi*r^2 */ 


circumference - 2 * pi * RADIUS; /* circumference - */ 
/* 2*pi*r */ 


printf ("Area of a circle with radius $f cm is tf cm^2\n", 
RADIUS, area); 


printf ("Circumference of the circle is $f cmWn", 
circumference); 
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图 12-11 计算 贺 面 积 和 周 长 (半径 为 15cm) 的 C 程 序 


前 缀 const 方 法 和 #define 定 义 符号 数值 方法 之 间 ， 没 有 本 质 区 别 ， 至 于 使 用 哪 种 方式 ， 只 是 编 
程 风格 的 问题 。 总 之 ， 如 果 我 们 认为 某 个 东西 ， 它 的 内 容 或 数值 不 会 改变 ， 则 可 以 将 其 定义 为 党 
量 。 例 如 ， 圆 周 率 常量 pi。 另 外 ， 光 速 、 一 星期 的 天 数 ， 都 可 以 表示 为 常量 。 

还 有 一 种 应 用 场景 ， 如 果 一 个 数值 在 同一 次 程序 执行 过 程 中 是 不 会 改变 的 ， 但 会 随 着 用 户 或 
场合 的 变化 而 变化 ， 则 可 以 使 用 #define 方 式 。 我 们 可 以 将 这 种 方式 定义 的 常量 ， 理 解 为 是 程序 参 
数 〈 每 次 运行 可 改变 的 ) 。 例 如 ， 图 12-1! 中 RADIUS 的 定义 就 是 这 种 方式 。 每 次 改变 之 后 ， 需 要 重 
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新 编译 ， 然 后 再 执行 。 
通常 ， 命 名 常量 的 方式 (如 const 或 #define 方 式 )， 比 直接 使 用 文字 常量 要 受 欢迎 一 些 ， 因 为 我 


们 可 以 通过 名 字 传 递 更 多 信息 《而 不 仅仅 是 常量 数值 本 身 ) 。 
12.6.3 存储 类 型 


前 面 介 绍 了 C 变 量 的 三 个 基本 属性 : 标识 符 、 类 型 和 作用 域 。 另 外 ， 变 量 还 有 一 个 属性 一 一 存 
储 类 (storage class)。 所 谓 “ 存 储 类 ”， 指 的 是 C 编 译 器 为 变量 分 配 存储 空间 的 方式 ， 以 及 在 代码 
块 执行 结束 时 ， 该 变量 内 容 是 否 会 丢失 的 问题 。C 语 言 支持 静态 (static) 和 自动 (automatic) 两 
种 存储 类 。 和 静态 变量 的 内 容 ， 在 两 次 启用 之 间 不 会 改变 ， 而 自动 变量 的 内 容 在 代码 块 结束 后 就 丢 
失 。 例 如 ， 在 C 语 言 中 ， 全 局 变量 就 属于 静态 存储 类 ， 即 它们 的 内 容 将 在 整个 程序 运行 期 内 都 一 直 
保持 ， 在 默认 情况 下 ， 局 部 变量 属于 自动 存储 类 。 但 如 果 局 部 变量 在 声明 时 ， 加 上 前 绎 修饰 符 
static, ， 则 它 就 属于 静态 类 。 如 “static int localVar;” 声 明 语 句 ， 说 明 变 量 localVar 的 内 容 ， 在 函数 
完成 后 一 直 保持 。 也 就 是 说 ， 如 果 该 函数 再 次 被 调用 ，localVar 的 内 容 仍然 为 上 次 运行 结束 时 的 值 。 
对 于 加 了 前 缀 static 的 局 部 变量 ， 编 译 器 将 在 全 局 数据 段 中 为 它 分 配 空间 ， 但 可 访问 范围 仍然 限制 
在 当前 代码 块 内 。 附 录 D3.3 是 有 关 存 储 类 的 更 多 的 例子 。 


12.6.4 更 多 的 C 运 算 符 


在 C 语 言 中 ， 还 包含 一 些 非常 规 运算 符 。 事 实 上 ， 它 们 几乎 就 是 C 语 言 的 标志 性 特征 。 这 些 运 
算 符 ， 大 多 是 在 基本 运算 符 的 基础 上 组 合 而 成 的 ， 但 它们 的 存在 使 得 表达 式 看 起 来 更 简单 。 对 于 
不 热 悉 组 合 运算 符 的 人 来 说 ， 阅 读 理解 它们 确实 是 件 费 力 的 事情 。 

1. 赋值 运算 符 

C 语 言 允许 某 些 算术 或 位 运算 符 与 赋值 运算 符 相 组 合 。 例 如 ， 我 们 对 变量 x 本 身 增 量 29， 则 可 
以 使 用 如 下 的 运算 符 “+=”: 

x += 29; 

该 语句 与 如 下 语句 等 价 。 

x= x t 29; 

表 12-6 所 示 是 C 语 言 具有 的 一 些 特殊 运算 符 。 其 中 ， 后 组 运算 符 的 优先 级 最 高 ， 共 次 是 前 缀 运 
算 符 ， 赋 值 运算 符 的 优先 级 最 低 。 关 联 顺序 都 是 自 右 向 左 。 


表 12-6 C 语 言 的 赋值 运算 符 


运算 符 B 作 "m A 
+= 加 后 赋值 x+=y 
-= RE [xy 
*= 乘 后 赋值 x*=y 
/= 除 后 赋值 x/-y 
- 取 余 后 赋值 x%=y 
&= 与 后 赋值 x &- y 
i- 或 后 赋值 xl=y 
^= 异 或 后 赋值 x^-y 
<<= 左 移 后 赋值 x <<=y 
>>= 右 移 后 赋值 x >>= 了 
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h += g; /* Equivalent toh=h+g; */ 
h &- f; /* Equivalent toh = h $ f; */ 
h <<= 3; /* Equivalent toh = h << 3; */ 
2. 条 件 表 达 式 


条 件 表达 式 是 C 语 言 特有 的 ， 它 可 以 在 一 个 表达 式 中 ， 同 时 完成 判断 和 赋值 这 两 个 操作 。 条 件 
表达 式 中 的 关键 符号 是 问号 “? ”和 冒号 “:”"。 如 下 所 示 : 
x=a?b:e; 
该 语句 的 意思 是 ，x 的 取 值 可 能 是 b， 也 可 能 是 c， 具 体 选 择 取决 于 表达 式 a 的 逻辑 值 。 如 果 a 为 
EFE ( 即 逻辑 真 ) ， 则 x 等 于 b 否则 ，x 等 于 c。 
#incluđe <stdio.h> 
int main() 
int maxValue; 


int inputl; 
int input2; 


printf("Input an integer: "); 
scanf {"%d", &inputl); 

printf ("Input another integer: "); 
scanf("td", &input2); 


maxValue = (inputl > input2) ? inputi : input2; 
printf ("The larger number is $&dWn", maxValue); 





图 12-12 C 程 序 中 的 条 件 表达 式 


图 12-12 所 示 是 一 个 使 用 条 件 表达 式 求 两 数 中 最 大 值 的 程序 。 两 个 输入 中 ， 最 大 的 数值 将 通过 
条 件 表达 式 赋 给 变量 maxValue， 最 后 由 printf 打 印 输出 maxValue 的 内 容 。 


12.7 小 结 


本 章 主要 讲述 了 以 下 三 方面 内 容 : 

*C 变 重 。C 语 言 支持 三 种 基本 变量 类 型 ， 整 型 、 字 符 型 和 浮 点 型 。 同 其 他 高 级 语言 一 样 ，C 
语言 允许 程序 员 为 变量 提供 符号 名 。C 变 量 的 声明 ， 可 以 在 某 个 代码 块 (如 罚 数 ) 内 ， 也 可 
以 是 全 局 可 见 的 。 

。C 运 算 符 。C 的 运算 符 ， 按 照 它们 的 行为 和 功能 来 分 ， 包 括 赋 值 、 算 术 、 位 运算 、 逻 辑 和 关 
系 测试 等 几 类 操作 。 表 达 式 是 变量 和 运算 符 的 组 合 ， 表 达 式 的 推算 过 程 遵循 优先 级 和 关联 顺 
序 规则 。 语 句 是 一 个 或 多 个 表达 式 的 组 合 ， 它 表达 的 是 程序 要 执行 的 任务 。 

。C 变 量 和 运算 符 的 编译 处 理 (LC-3 代 码 )。 在 编译 过 程 中 ， 编 译 器 将 被 声明 的 变量 记录 在 “变量 
符号 表 ” 中 。 基 于 这 个 符号 表 ， 编 译 器 为 特定 函数 内 的 局 部 变量 分 配 “ 活 动 记录 ”空间 。 当 该 函 
数 被 调用 时 ， 该 函数 的 活动 记录 被 压 人 栈 区 段 。 程 序 中 ， 全 局 变量 的 分 配 空 间 在 全 局 数据 段 中 。 


12.8 习题 
12. 写 出 如 下 代码 的 编译 器 变量 符号 表 。 假 设 其 中 每 个 变量 占用 一 个 独立 的 内 存 空 间 。 


{ 
double ff; 
char cc; 
int ii; 
char dd; 


2 


12.2 ”以 下 是 一 个 变量 声明 语句 ，; 
int r; 
Wi]: 
a. 如 果 r 是 局 部 变量 ， 它 的 初始 值 为 多 少 ? 
b. 如 果 r 是 全 局 变量 ， 它 的 初始 值 为 多 少 ? 
12.3 如果 下 面 两 个 变量 的 存储 空间 都 是 32-bit， 试 问 它 们 的 数值 范围 是 多 少 ? 


int plusOrMinus; 
unsigned int positive; 


124 请 写 出 如 下 浮 点 常数 的 十 进 制 数值 。 
a. 111E—11 
b. —0.00021 E4 
c. 101.101 E0 
12.5 如 果 使 用 LC-3 C 编 译 器 ， 请 写 出 如 下 局 部 变量 声明 语句 所 对 应 的 LC-3 汇 编 代码 。 
char c = 'a'; 
int x = 3; 


int y; 
int z - 10; 


12.6 ” 写 出 如 下 代码 中 ， 每 个 printf 语 句 的 输出 结果 。 语 名 执行 顺序 是 A、B、C、D。 


int t; /* This variable is global */ 


( 


int t = 2; 


printf("&dWMn", t); /* A */ 


printf("&dWn", t); /* B */ 
t 3; 


) anctor, t): /[* C */ 
{ 
À printf("&din", t); /* D */ 
12.7 已 知 变量 a 和 b 都 是 正 数 ， 它 们 的 值 分 别 为 6 和 9。 试 问 如 下 表达 式 的 结果 是 什么 ?如 果 a 或 b 的 


值 改 变 了 ， 请 写 出 它们 的 新 值 。 


aalb b.a || b ca&b d.a && b 
e. i (a + b) fat*b gb/a h. a = Pb 
La=b=5 j **a + b-- k.a = (+b < 3) ?a:b La <<= b 


12.8 有关 如 下 字符 变量 letter 的 关系 测试 问题 ， 写 出 对 应 的 C 语 言 表达 式 。 
a. 测试 letter 是 否 为 字母 或 数字 ， 
b. 测试 letter 是 否 包含 字母 或 数字 之 外 的 字符 。 

12.9 ” 试 回 答 以 下 间 题 : 
a. 如 下 语句 的 执行 结果 是 什么 ? 其 中 变量 letter 是 一 个 字符 变量 ， 


letter = ((letter >= 'a' && letter <= 'z') ? '!' : letter); 


b. 修改 (a) 中 的 语句 ， 以 使 得 新 语 名 能够 将 小 写字 母 转换 为 大 写字 母 。 

12.10. 试 编写 程序 ， 从 键盘 读 人 整数 并 进行 判断 ， 如 果 能 被 3 整除 ， 则 显示 输出 “1” ， 否 则 ， 显 
示 输 出 “0”。 

12.11 试 解释 以 下 各 C 语 句 之 间 的 不 同 : 


a.j = itt; b.j = ++i; cj=i+ 1; 
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12.13 


12.14 


12.15 
12.16 


12.17 


12.18 


12.19 


12.20 


£12* 


di += 1; ej= i+ 1; 
f. 以 上 语句 中 ， 谁 修改 了 i 的 值 ? 谁 修改 了 j 的 值 ? 如 果 初 始 值 i = 1，j = 0， 试 问 以 上 每 条 
语句 执行 之 后 ，i 和 jj 的 值 是 什么 ? 
假设 变量 a 和 b 都 被 声明 为 “long int” 类 型 的 局 部 变量 ， 试 问 ， 
a. 写 出 表达 式 “a + b” 的 LC-3 汇 编 代 码 。 其 中 ， 假 设 “long int” 类 型 占用 空间 是 两 个 字 
节 ，a 对 应 函数 活动 记录 的 偏 移 0 位 置 ，b 对 应 活动 记录 的 偏 移 一 1 位 置 ， 
b. 如 问题 (a) 所 示 ， 假 设 类 型 “long int” 占 用 4 个 字 节 ，a 为 偏 移 ，，b 为 偏 移 -2。 请 写 出 
对 应 的 LC-3 汇 编 代码 。 
假设 初始 情况 是 : a = 1、b = 1、c = 3、Tesult = 999。 试 则 ,执行 如 下 语 旬 之 后 ， 各 变量 的 
值 分 别 为 多 少 ? 
result =b c 1| c * à; 
回顾 第 2 章 中 机 器 “ 忙 ”的 例子 。 其 中 ， 变 量 machineBusy 记 录 的 是 16 台 机 器 的 忙碌 状态 。 
对 应 bit 的 值 如 果 为 0， 代 表 该 机 器 正在 “忙碌 ”， 如 果 为 1， 则 代表 该 机 器 “空闲 ”。 
a. 编写 C 语 句 ， 设 置 5 号 机 器 “人 忙碌”， 
b. ASCE, REISILE “ZW” 
c. 编写 C 语 句 ， 设 置 第 n 号 机 器 “忙碌 ”。 其 中 ，8 是 一 个 整 型 变量 。 
d. 编写 C 表 达 式 ， 检 验 3 号 机 器 是 否 “ 空 亲 ” 。 如 果 “ 空 闲 ”， 则 表达 式 结 果 为 1， 如 果 “ 忙 
委 "， 则 表达 式 结 果 为 0。 
e. 编写 C 表 达 式 ， 计 算 空闲 机 器 的 总 数 。 例 如 ， 假 设 machineBusy 的 二 进 制 值 为 1011 0010 
1110 1001， 则 表达 式 结 果 应 该 为 9。 
试问 ， 在 C 语 言 中 ， 分 号 的 作用 是 什么 ? 
假设 我 们 为 计算 机 设计 一 个 新 的 编程 语言 ， 其 中 包含 @、#、$、0U 等 运算 符 。 试 问 ， 在 如 
下 条 件 下 ， 表 达 式 “w@x#y$zUa” 的 推算 顺序 分 别 是 什么 ? 
a. 假设 运算 符 优先 级 顺序 (从 高 到 低 ) 为 : @、#、$、U。 提 示 : 采用 括号 表达 计算 顺序 ， 
如 ((w@x) ..) ; 
b. 假设 运算 符 优先 级 顺序 (从 高 到 低 ) 为 : 4, U, @, $, 
c. 假设 它们 的 优先 级 都 相等 ， 关 联 顺序 为 自 左 向 右 ， 
d. 假设 它们 的 优先 级 都 相等 ， 关 联 顺 序 为 自 右 向 左 。 
我 们 都 知道 ， 在 C 语 言 中 ， 赋 值 运算 符 的 优先 级 最 低 。 假 设 我 们 设计 了 一 种 新 的 编程 语 
言 一 一 语言 。 它 与 C 语 言 工作 原理 相同 。 只 是 在 Q 语 言 中 ， 赋 值 运 算 符 的 优先 级 最 高 。 试 问 : 
a. 如 下 Q 语 句 的 执行 结果 如 何 ? 换 句 话说 ， 读 语句 执行 之 后 ，x 的 值 是 多 少 ? 

x= x + 1}; 
b. 怎样 修改 该 Q 语 名 ， 以 使 得 运算 结果 和 对 应 的 C 语 名 结果 一 样 。 
试 对 第 11 章 的 程序 (如 图 11-3 所 示 ) 做 出 修改 ;提示 用 户 输入 字符 ， 然 后 按照 ASCII 表 的 顺 
序 ， 从 该 字符 起 ， 逐 个 字符 打印 ， 直 到 字符 “! ”结束 。 
试 编写 一 个 “交易 税 计算 ”程序 : 提示 用 户 输 入 “采购 金额 ”(purchase amount) 和 “税率 ” 
(tax rate) 然后， 打印 输出 “交易 税 ”(sales tax) 和 “交易 总 额 (包括 税 款 )”( 提 示 : 
交易 总 额 = 采购 金额 + 交易 税 )。 
假设 程序 含有 两 个 整 型 变量 x 和 y， 且 它们 的 数值 分 别 为 3 和 4。 试 编写 C 语 句 ， 交 换 x 和 y 的 
值 ， 即 语句 执行 之 后 ,x = 4, y= 3。 
a. 第 一 种 方式 ， 人 允许 使 用 中 间 变 量 ， 写 出 这 个 程序 ， 
b. 第 二 种 方式 ， 不 允许 使 用 中 间 变 量 ， 写 出 相应 的 程序 。 


第 13 章 控制 结构 


13.1 概述 


在 第 6 章 中 ,介绍 了 人 “ 自 顶 向 下 ”方法 学 ， 经 过 系统 的 细 化 ， 一 个 大 问题 被 分 解 为 多 个 子 任务 ， 
然后 对 每 个 子 任务 独立 编程 。 各 种 子 任务 的 基本 编程 结构 (construct). 可 以 分 为 顺序 、 条 件 和 循环 
三 种 等 。 

在 前 一 章 的 “网 络 传输 时 间 ”问题 求解 中 ， 我 们 就 采用 了 这 种 系统 分 解 方法 ， 只 是 在 那个 例 
子 中 ， 我 们 只 用 到 了 顺序 结构 。 如 果 要 求解 更 复杂 的 问题 ， 我 们 还 需要 掌握 另外 两 种 C 语 言 结构 的 
编程 技术 ， 即 条 件 结构 和 循环 结构 。 

本 章 的 第 一 个 内 容 是 C 语 言 的 “条 件 结构 ”， 我 们 称 if 和 if-else 语 句 为 “条 件 执 行 语句 "。 之 后 ， 
是 C 语 言 的 “循环 结构 "， 如 for、while 和 do-while 语 句 ， 它 们 都 可 以 表达 循环 操作 。 随 后 ， 我 们 将 
介绍 LC-3 C 编 译 器 怎样 为 这 些 语句 生成 对 应 的 LC-3 代 码 ， 即 这 些 C 结 构 的 底层 行为 。 此 外 ，C 语 言 
还 提供 了 诸如 switch、break 和 continue 等 控制 结构 ， 但 所 有 这 些 都 只 是 为 实现 特定 控制 任务 提供 了 
更 直接 的 描述 方式 〈 参 见 13.5 节 )。 最 后 ， 我 们 将 演示 ， 如 何 通过 “ 自 顶 向 下 ”方法 ， 以 及 这 些 控 
制 结 构 ， 解 决 一 个 复杂 问题 。 


13.2 条 件 结构 


条 件 结构 的 作用 ， 是 使 得 程序 员 可 以 基于 “特定 条 件 ” 选 择 程序 的 “动作 ”。 这 是 一 种 非常 有 用 
的 编程 结构 ， 几 平 每 类 编程 语言 都 支持 这 种 结构 。C 语 言 为 此 提供 了 两 种 基本 条 件 结构 ，if 和 if-else。 


13.2.1 if 语句 


if 语句 非常 简单 。 它 的 语义 是 ， 如 果 条 件 为 “ 真 "， 则 执行 特定 动作 。 所 谓 “动作 ”(action)， 
是 一 个 C 语 句 ， 当 上 且 仅 当 条 件 〈C 表 达 式 ) 为 真 时 ， 才 执行 该“ 动作 ”语句 。 下 面 ， 我 们 以 例子 来 
说 明 它 的 使 用 方法 。 | 


if (x «- 10) 
Y= XX* x + 5; 


其 中 ， 当 且 仅 当 表 达 式 “x <= 10” 为 真 时 ,语句 “y = x * x +5” 才 被 执行 。 回 顾 一 下 有 关 运 
算 符 “<=” 的 讨论 ， 它 是 一 个 关系 运算 符 。 当 关系 成 立时 ， 表 示 式 值 为 1， 否则， 表达 式 值 为 0。 

条 件 表达 式 之 后 的 语句 ， 可 以 是 一 条 单独 语句 ， 也 可 以 是 一 个 复合 语 自 (或 代码 块 ， 即 括号 
{所 包围 的 代码 序列 )。 所 谓 复合 语句 ， 是 由 一 个 或 多 个 简单 语句 组 合 而 成 的 单独 实体 ， 该 实体 在 
程序 结构 上 等 价 于 一 个 简单 语句 。 基 于 复合 语句 ， 我 们 可 以 只 做 一 次 条 件 判断 ， 而 连续 执行 多 个 
语句 。 例 如 ， 如 下 代码 中 ， 如 果 x 小 于 等 于 10， 则 y 和 z 都 会 被 改变 。 

if bs 10) { " 

z= (2 * y) / 3; 

在 C 语 言 中 ,语句 的 使 用 格式 非常 灵活 ，if 语 名 也 不 例外 。 如 前 面 这 个 例子 ,分 行 和 缩 进 就 是 


这 语句 常用 的 格式 风格 。 这 种 格式 的 特点 是 ， 代 码 阅读 者 可 以 快速 区 分 出 ， 哪 些 语句 是 条 件 为 真 时 
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要 被 执行 的 ， 包 些 语句 是 条 件 为 假 时 要 被 执行 的 。 值 得 一 提 的 是 ， 格 式 上 的 差异 并 不 会 影响 程序 
的 行为 behavior。 但 是 ， 下 面 这 段 代码 、 虽 然 与 上 面 代码 非常 相似 
(如 缩 进 ) ， 但 执行 时 的 行为 却 完全 不 同 。 因 为 ， 其 中 的 第 二 个 语句 


"z2(2*y)/3;" 与 过 语句 之 前 不 存在 任何 关联 , 即 无 论 条 件 是 否 为 真 ， F 
该 语句 都 被 执行 。 条 件 
if (x <= 10) 


Y= X* Xx + 5; 
z= (2* y) / 3; 
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if (condition) 动作 
action; 
从 语法 上 来 讲 ， 条 件 表达 式 必 须 用 圆 括号 包围 ， 只 有 这 样 ， 编 译 
器 才能 明确 哪 部 分 代码 属于 条 件 表达 式 ， 而 动作 部 分 代表 的 是 一 个 简 
单 语句 或 复合 语句 。 mM 
下 面 是 一 个 if 语句 的 例子 ， 请 体会 判断 (或 条 件 ) 结构 在 编程 中 en 


的 作用 。 


if (temperature <= 0) 
printf("At or below freezing point.\n"); 


if ('a' <= key && key <= 'z') 
numLowerCase--*; 


if (current » currentLimit) 
blownFuse = 1; 


if (loadMAR & clock) 
registerMAR - bus; 


if (month == 4 || month == 6 || month == 9 || month == 11) 
printf ("The month has 30 days Win"); 

if (x = 2) /* This condition is always true. */ 
y= 5; /* The variable y will always be 5 */ 


在 最 后 一 段 代 码 中 ， 存 在 一 个 编程 错误 。 这 是 一 个 常见 的 C 语 言 编程 错误 ， 甚 至 很 多 高 级 程序 
员 也 难免 有 时 会 犯 。 当 然 ， 功 能 强大 的 C 编 译 器 能 够 检测 到 类 似 错误 ， 并 输出 警告 提示 。 这 个 错误 
是 ， 条 件 表 达 式 中 使 用 的 是 赋值 运算 符 (=) ， 而 不 是 关系 运算 符 (==)。 这 样 的 执行 结果 是 ， 变 量 
x 被 赋值 为 2， 且 从 条 件 计算 角度 来 说 ， 该 条 件 永远 为 真 ( 因 为 ， 如 果 表 达 式 是 一 个 赋值 运算 ， 则 
表达 式 值 即 为 该 数值 ， 此 处 为 2)。 由 于 条 件 永 远 为 真 ， 所 以 事实 上 的 执行 结果 是 ， 变量 y 总 被 赋 为 
5，x 则 总 被 赋 为 2。 l 

如 下 是 修复 后 的 代码 ， 它 与 之 前 的 代码 非常 相似 。 


if (x == 2) 
y = 5; 


下 面 是 与 之 对 应 的 LC-3 代 码 。 我 们 的 假设 是 ，x 和 y 都 是 整 型 变量 ， 且 都 是 局 部 变量 。 肥 R5 指 
向 的 是 变量 x，R5-1 指 向 的 是 变量 y。 


LDR R0, R5, #0 ; load x into RO 

ADD RO, RO, #-2 ; subtract 2 from x 

BRnp NOT TRUE ; If condition is not true, 
; then skip the assignment 


AND RO, RO, HO ; RO <- 0 
ADD RO, RO, #5 ; RO «- 5 
STR RO, R5, 8-1; y= 5; 


NOT TRUE : ; the rest of the program 


注意 ，LC-3 汇 编 语言 中 ， 测 试 的 是 与 原 条 件 相反 的 条 件 ( 即 “x 不 等 于 2* ) ， 然 后 根据 这 个 反 
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条 件 的 值 ， 决 定 是 否 跳 转 。 对 于 C 编 译 器 来 说 ， 这 是 代码 效率 最 高 的 处 理 方法 。 

值得 一 提 的 是 ，if 语 名 中 的 动作 ， 也 可 以 是 又 一 个 让 语句 。 换 旬 话 说 ，C 语 言 支持 “ 修 套 if” 格 
式 。 如 下 面 C 代 码 所 示 ， 此 处 由 于 第 一 个 过 之 后 的 让 语句 属于 简单 语句 ， 所 以 第 一 个 计 之 后 不 需要 大 
括号 包围 。 


if (x == 3) 
if (y != 


} 
内 层 的 if 语句 ， 当 且 仅 当 x 等 于 3 时 才 被 执行 。 这 段 代 码 还 有 一 种 更 简单 的 表达 方法 。 能 否 只 使 
用 一 个 这 语句 昵 ? 参见 如 下 代码 。 


if ((x == 3) && ly != 6)) { 
i; 


Zz + 
w+ 2; 


EN 


} 
13.2.2 if-else f 


如 果 希 望 条 件 为 真 时 执行 某 个 动作 ， 而 条 件 为 假 时 执行 另 一 个 动作 。 那 么 ， 它 的 if 语 名 表达 方 
式 如 下 : 


if (temperature <= 0) 
printf ("At or below freezing point.\n"); 


if (temperature » 0) 
printf ("Above freezing. Mn"); 


其 中 ， 变 量 temperature 的 值 或 小 于 等 于 0， 或 大 于 0。 
与 两 种 情况 对 应 ， 打 印 的 两 个 消息 也 不 同 。 这 种 条 件 执 
行 场景 (或 需求 )， 在 实际 编程 中 非常 普遍 。 但 前 面 这 种 
表达 方式 ， 看 起 来 有 些 烦琐 。 为 此 ，C 语 言 提 供 了 另 一 
种 结构 ，if-else 语 句 。 

如 下 代码 的 执行 效果 ， 与 前 面 的 代码 等 价 : 


if (temperature <= 0) 

printf("At or below freezing point. An"); 
else 

printf ("Above freezing.Mn"); 





else 情 况 下 的 动作 





这 情况 下 的 动作 


其 中 ， 当 且 仅 当 条 件 值 为 假 时 ， 关 键 词 else 后 面 的 语 
句 才 被 执行 。 

if-else 语 名 对 应 的 控制 流程 图 ， 如 图 13-2 所 示 。 与 之 ”图 13-2 C 语 言 里 if-else 语 句 的 控制 流程 图 
对 应 的 代码 结构 如 下 所 示 : 

ie 


else 
action else; 


其 中 ，action_ifHaction_else 所 代表 的 可 以 是 一 个 复合 语句 ， 如 下 面 例子 所 示 : 
if (x) { 
yt: 


) 


eise { 


Y--; 
Zt; 


其 中 ,如果 变 量 x 为 非 零 ， 即 计 条 件 为 真 ， 则 执行 ?递增 和 z 递 减 ， 否则 ， 执 行 y 递 减 和 z 递 增 。 
与 之 对 应 的 LC-3 的 代码 ， 如 图 13-3 所 示 。 假 设 条 件 是 ， 变 量 x、y 和 z 都 是 局 部 声明 的 整 型 变量 。 
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load the value of x 
if x equals 0, perform else part 


load y into RO 


yet: 


(€ - 0$ Ut os wiere 


load z into 


z--i 


load y into 
y--: 
load z into 


Zt; 





图 13-3 if-else 语 名 对 应 的 LC-3 代 码 
我 们 还 可 以 将 多 个 条 件 结构 组 合 ， 形 成 更 长 的 条 件 测试 序列 。 图 13-4 所 示 是 由 一 系列 if 和 if- 
else 语 句 串 联 在 一 起 ， 而 组 成 的 复杂 条 件 判断 结构 (其 中 没有 使 用 任何 其 他 控制 结构 )。 程 序 的 功 
能 是 ， 读 和 用户 输入 的 月 份 数 ， 然 后 打印 输出 该 月 的 天 数 。 


#include «<stdio.h> 
int main() 
int month; 


printf("Enter the number of the month: "); 
scanfí("*d", &month); 


Dam wb 


if (month == 4 || month == 6 || month == 9 || month == 11) 
printf("The month has 30 daysWn"); 
else if (month == 1 || month == 3 || month == 5 || 
month == 7 || month == 8 || month == 10 || month == 12) 
printf ("The month has 31 daysWn"); 
else if (month == 2) 
printf("The month has either 28 days or 29 daysWMn"); 
else 
printf ("Don’t know that monthWn"); 





图 13-4 输出 一 个 月 的 天 数 的 程序 


在 此 ， 我 们 要 强调 一 下 C 语 言 的 让 和 else 关 联 规则 : ERR E (nest) 或 串联 方式 下 ，else 总 是 与 
它 距 离 最 近 的 证 发 生 关 联 。 以 如 下 代码 为 例 ， 我 们 来 看 一 下 该 语法 规则 的 重要 性 。 


if (x != 10) 
if (y » 3) 
z2z/2; 
else 
Z2Z22*23 


如 果 没 有 规则 ， 我 们 将 无 法 确定 代码 中 的 else 是 与 外 层 的 if 配对 ， 还 是 与 内 层 的 if 配对 。 注 意 ， 
两 种 假设 下 ， 执 行 效果 是 完全 不 一 样 的 。 

按照 规则 ， 这 个 else 应 该 与 内 层 的 这 配对 ， 因 为 它 与 else 之 间 的 距离 最 短 。 所 以 ， 根 据 规则 ， 
上 面 代码 与 如 下 代码 (注意 括号 的 包围 ) 是 等 价 的 : 
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if (x != 10) { 


if (y > 3) 
z-zz/ 

else 
2-z*2 


) 

与 表达 式 中 的 圆 括号 作用 相似 (改变 运算 符 关 联 顺序 ) ， 大 括号 在 此 的 作用 是 改变 语句 关联 的 
顺序 。 再 假设 ， 如 果 我 们 希望 该 else 与 外 层 计 相关 联 ， 则 大 括号 的 用 法 如 下 所 示 ; 

"gm 

z-2/2i 

} 

else 

最 后 , 在 结束 if-else 语 句 之 前 , 我 们 介绍 一 个 if-else 结 构 在 编程 中 的 应 用 技巧 ; 使 用 if-else 语 句 ， 
检测 程序 中 存在 的 错误 。 如 图 13-5 所 示 ， 程 序 从 键盘 读 人 两 个 数值 ， 然 后 两 者 相 除 。 由 于 除数 为 0 
是 “非法 的 "， 所 以 如 果 检 测 到 用 户 输入 的 除数 为 0， 则 打印 错误 提示 消息 。 在 此 ， 我 们 发 现 if-else 
语句 很 适合 于 该 任务 。 

值得 一 提 的 是 ， 在 错误 检测 的 例子 中 ,正确 的 情况 (或 动作 ) 通常 出 现在 it-else 结 构 的 过 部 分 ， 
而 错误 情况 出 现在 else 部 分 。 当 然 ， 它 们 的 先后 顺序 完全 可 以 互 换 ， 即 先是 错误 情况 再 是 正确 情 
况 。 但 是 ， 从 阅读 习惯 上 来 说 ， 人 们 更 习惯 于 假设 先 看 到 的 是 正常 情况 (因为 错误 情况 出 现 概率 


非常 小 )。 
13.3 循环 结构 


能 够 循环 (或 重复 ) 执行 一 个 计算 任务 ， 是 计算 系统 的 一 个 重要 能 力 。 几 乎 所 有 的 程序 都 含 
有 某 种 形式 的 循环 。C 语 言 支持 三 种 循环 结构 ， 它 们 之 间 存 在 一 些 细微 差别 ， 即 while、for 和 do- 
while 三 种 语句 。 


#include <stdio.h> 
int main() 
int dividend; 
int divisor; 


int result; 


printf("Enter the dividend: "); 
scanf("&d", &dividend); 


printf("Enter the divisor: "); 
Scanf("&d", &divisor); 


if (divisor !- 0) { 
result - dividend / divisor; 
printf("The result of the division is *dWMn", result); 


else 
printf ("A divisor of zero is not allowedWM"); 





图 13-5 有 错误 检查 代码 的 程序 
13.3.1 whilei& fg 
语言 中 最 简单 的 循环 语句 是 while 语 句 。 它 的 含义 是 :“ 只 要 ”(while) 条 件 为 真 ， 则 重新 执 
行 某 条 语句 。” 具 体 地 说 ， 就 是 每 次 选 代 之 前 ， 都 再 次 检查 条 件 。 如 果 条 件 为 逻辑 真 ( 非 零 值 ) , 
则 该 语句 就 再 次 被 执行 
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例如 ， 当 变量 x 小 于 10 时 ， 则 循环 体 代 码 重 复 执行 。 该 程序 的 输出 结果 如 下 所 示 :; 


0123459672829 
4include «stdio,.h» 
int main() 
int. x = 0; 
while (x < 10) f 
printf ("$d ", x); 
X=X+ l; 


) 
] 


我 们 将 while 语 句 划分 为 两 部 分 。 一 是 产生 条 件 结果 的 表达 式 ， F 
如 test， 它 决定 了 循环 是 否 需要 继续 。 每 次 循环 体 (loop_body) 
被 执行 之 前 ， 它 都 将 被 测试 。 二 是 循环 体 (loop_body)， 它 代表 

每 次 循环 所 要 完成 的 工作 。 同 样 ， 它 也 可 以 是 一 个 复合 语句 。 


while (test] 


loop body; 循环 体 

图 13-6 所 示 是 “系统 分 解法 ”中 标识 while 语 句 的 控制 流程 

图 。 图 中 存在 两 个 分 支 ; 一 个 退出 循环 体 (条 件 分 支 )， 另 一 个 一 

跳 回 条 件 测试 语句 test (无 条 件 跳 转 )。 136 while fokot aE 
图 13-7 所 示 是 对 应 干 循环 输出 0~9 的 while 程 序 ， 由 编译 器 生成 的 LC.3 代 码 ， 


AND RỌ, RO, #0 i Clear out RO 
STR RO, R5, #0 i X = 0; 


; while (x < 10) 

LDR R0, R5, #0 : perform the test 

ADD R0, RO, #-10 

BRpz DONE ; X is not less than 10 


1 
2 
3 
4 
5 
6 
7 
8 


; loop body 
«code for calling the function printf» 


RO, R5, #0 i RO «- x 

RO, RO, #1 ; X*1 

RO, R5, #0 H X-2x241l; 

LOOP ; another iteration 





图 13-7 从 1 数 到 9 的 while 循 环 对 应 的 LC-3 代 码 
在 “哨兵 (sentinel) 条 件 测 试 ”类 的 循环 中 ，while 语 名 非常 合适 。 所 谓 “ 哨 兵 条 件 ”， 是 指 
循环 次 数 事先 是 不 确定 的 ， 程 序 将 无 限 循环 ， 直 到 发 生 某 个 “事件 ”( 即 出 现 “ 哨 兵 ") 为 止 。 例 
如 ， 第 5 章 和 第 7 章 的 字符 统计 程序 ， 计 数 过 程 持续 循环 ， 直 到 遇 到 字符 EOT (End-Of-Text, ASCI 
码 值 为 4) 为 小 。 如 果 用 C 语 言 (而 不 是 LC-3 汇 编 语 言 ) 编写 该 程序 ， 我 们 就 可 以 使 用 while 语 句 ， 
如 图 13-8 所 示 。 请 在 不 执行 这 个 程序 的 情况 下 ， 猜 测 读 程 序 的 运行 结果 。S 
在 结束 while 话 题 之 前 ， 我 们 再 介绍 一 个 使 用 while 时 常 犯 的 错误 。 如 下 程序 将 永远 不 会 终止 ， 
因为 循环 条 件 始终 没有 改变 。 且 该 例 中 ， 条 件 总 为 真 ， 所 以 循环 不 会 终止 。 我 们 称 这 种 循环 为 
“AII” (infinite loop)， 且 这 类 错误 的 原因 都 是 源 于 程序 员 。 
O iin: 该 程序 的 运行 结果 和 你 想像 的 可 能 不 同 。 也 许 你 认为 ， 当 用 户 输入 字符 之 后 ， 它 会 马上 被 打印 出 来 。 
但 实际 上 ，C 语 言 处 理 键盘 IO 的 方法 是 ， 如 果 用 户 不 按 回 车 键 ， 则 程序 读 不 到 任何 输入 。 我 们 将 在 第 18 章 
讲述 底层 IO 时 ， 再 解释 其 原因 。 
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#include <stdio.h>» 


int main() 


char echo = 'A'; /* Initialize char variable echo */ 


while (echo !- 'W') ( 
scanf ("%c", &echo); 
printf("$c", echo); 
} 
} 





图 13-8 另 一 个 使 用 简单 while 循 环 的 程序 


#include «stdio.h» 
int main() 
int x - 0; 
while (x « 10) 


printf("td ", x); 
) 


13.3.2 for 语 名 


如 果 说 while 循 环 适合 于 “哨兵 条 件 ” 控 制 的 循环 ， 则 C 语 言 的 for 请 句 则 非常 适合 于 “计数 器 ” 
控制 的 循环 。 换 句 话说 ，for 循 环 是 while 循 环 在 事先 知道 循环 次 数 的 情况 下 的 一 个 特例 。 
for 语 句 最 常见 的 使 用 形式 ， 是 重复 执行 一 个 语句 ， 且 次 数 国定 。 如 下 所 示 ， 
*include <stdio.h> 
int main() 
int x; 
for (x = 0; X < 10; xe») 
printf ("$d ", x); 
该 程序 循环 执行 10 次 ， 运 行 输出 的 结果 如 下 : 
0123456789 
for 语 名 的 语法 结构 ， 初 看 起 来 让 人 感觉 有 些 烦 融 。for 语 句 包括 4 个 组 成 部 分 ， 如 下 所 示 : 


for (init; test; reinit) 
loop body; 


括号 中 的 三 个 部 分 是 init、test 和 reinit ， 它 们 控制 着 循环 的 动作 ， 
且 之 间 用 分 号 障 开 。 最 后 一 个 部 分 是 loop_body， 代 表 每 次 循环 中 执 
行 的 运算 。 
下 面 详 细 解 释 for 循 环 结构 的 4 个 部 分 ， 
。init (初始 化 ); 是 在 第 一 次 循环 前 要 被 执行 的 表达 式 。 通 常 ， 
它 被 用 做 循环 初始 化 。 
: test (REMA): 是 每 次 循环 都 要 被 执行 的 判断 表达 式 ， 判 
新 循环 是 否 还 需要 继续 。 如 果 test 表 达 式 的 值 为 零 ， 则 for 循 
环 终止 ， 控 制 权 转移 至 for 下 面 的 语句 ， 相 反 ， 如 果 表 达 式 值 
非 零 ， 则 继续 下 一 轮 loop_body 的 执行 。 例 如 ， 前 面 例子 中 ， 
表达 式 “x < 10” 表 示 的 是 “只 要 x 小 于 10， 循 环 就 继续 ”。 
: reinit. (重新 初始 化 ); 是 每 次 循环 结束 之 后 ， 都 要 被 执行 的 表 
达 式 。 它 表示 为 下 一 次 循环 所 做 的 准备 (所 以 又 称 为 
"reinitialize") 。 如 前 例 中 ， 每 次 下 一 循环 之 前 ， 变 量 x 都 先 被 
递增 1。 





重新 初始 化 


图 13-9 for 语 句 的 控制 流程 图 
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* loop body (循环 体 ): 是 每 次 循环 都 要 被 执行 的 语句 。 同 样 ， 它 可 以 是 一 个 复合 语句 。 
图 13-9 所 示 是 for 语 句 的 控制 流程 图 。 该 图 中 包含 4 个 模块 ， 分 别 对 应 for 语 句 的 4 个 部 分 。 其 中 ， 
test 表 达 式 是 一 个 条 件 分 支点 ， 该 条 件 表达 式 的 结果 决定 了 循环 过 程 是 继续 还 是 退出 。 最 后 的 reinit 


表达 式 ， 是 一 个 无 条 件 跳 转 点 ， 返 回 test 模 块 。 
尽管 for 语 名 的 灵活 性 使 得 循环 的 控制 方法 可 以 多 种 多 样 。 但 事实 上 ， 你 所 遇 到 的 (或 自己 
编写 的 ) for 循 环 都 是 计数 器 控制 方式 的 ， 即 循环 次 数 是 固定 的 。 如 下 是 计数 器 方式 控制 的 for 循 


环 例子 。 


/* --- What does the loop output?  --- */ 
for (x = 0; x <= 10; X++) 
printf("&d ", x); 


/* --- What does this one output?  --- */ 
letter = 'a'; 
for (c = 0; c < 26; C++) 

printf("$c ", letter + c); 


/* --- What does this loop do? --- */ 
numberOfOnes = 0; 


for (bitNum = 0; bitNum < 16; bitNum««) { 
if (inputValue & (1 << bitNum)) 
numberOfOnes-«-; 


) 
再 看 下 面 的 for 循 环 例子 ， 以 及 它 所 对 应 的 LC-3 程 序 。 该 程序 的 功能 很 简单 ， 计 算 0~9 的 整数 和 。 


Hinclude <stdio.h> 
int main() 


int x; 
int sum - 0; 


for (x = 0; x < 10; x++) 
sum - sum 4 X; 


j 
编译 器 为 以 上 C 代 码 生成 的 LC-3 代 码 ， 如 图 13-10 所 示 。 


AND RO, RO, #0 ; Clear out RO 
STR RO, R5, 4-1 ; sum - 0; 


; init 
AND RO, RO, ; clear out RO 
STR R0, R5, H init (x = 0) 


; test 

LDR RO, R5, ; perform the test 

ADD RO, RO, 

BRpz DONE ; x is not less than 10 


: loop body 
RO, . i get x 
R1, . ; get sum 
R1, , i sum + x 
RO, , ; sum = Sum + X; 


; reinit 
RO, ; get x 
RO, 
RO, n ; X++ 
LOOP 





图 13-10 for 语句 对 应 的 LC-3 代 码 
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如 下 for 循 环 代 码 中 ， 存 在 一 个 常见 的 错误 。 


sum = 0; 
for (x = 0; x < 10; X++); 
sum = sum + X; 


printf{"sum = $d\n", sum); 
printf ("x = $dWn", x); 


试问 , 第 一 个 printf 的 输出 是 什么 ? 管 案 是 “sum = 10", 为 什么 ?第 二 个 printf 的 输出 则 是 “x = 10", 
这 又 是 为 什么 ? 这 两 个 答案 与 你 推测 的 是 否 一 样 ? 如 果 你 仔细 阅读 ， 会 发 现 问题 出 在 分 号 的 误 用 上 。 

for 能 完成 的 循环 操作 ， 换 做 while 也 可 以 等 价 实现 。 反 之 亦 然 。 既 然 两 种 循环 语句 在 某 种 程度 
上 可 互 换 ， 那 么 在 编程 中 选用 哪 一 个 更 合适 呢 ? 这 个 问题 很 难 回答 。 但 有 一 定 通用 规则 : while 适 
合 “ 哨 兵 条 件 ”， 而 for 适 合 已 知 循环 次 数 的 情况 。 

4f P ak 

图 13-11 所 示 是 一 个 for 循 环 结构 , 同时 它 的 循环 体 也 是 一 个 for 结 构 。 这 种 一 个 循环 结构 (内 层 ) 
伐 套 在 另 一 个 循环 结构 (外 层 ) BUE, RA “MARKE” (nested loop)。 此 处 的 任务 是 打印 出 0 
到 9 的 乘法 表 。 其 中 ， 外 层 循环 每 次 负责 打印 一 整 行 ，10 次 循环 即 意味 着 10 行 ， 内 层 循 环 每 次 打印 
一 个 乘积 值 ， 每 循环 10 次 完成 一 行 打 印 。 注 意 ，printf 中 的 特殊 字符 “XY” 代表 一 个 tab 字 符 ， 它 起 
到 的 是 对 齐 作用 ， 使 每 列 输出 更 整齐 。 


#include «stdio.h» 


int main() 

{ 
int multiplicand; /* First operand of each multiply  */ 
int multiplier; /* Second operand of each multiply */ 


/* Outer Loop */ 
for (multiplicand = 0; multiplicand < 10; multiplicand««) { 
/* Inner Loop */ 
for (multiplier = 0; multiplier < 10; multiplier««) { 
printf("*dWXt", multiplier * multiplicand); 
} 


printf ("Mn"); 





图 13-11 一 个 打印 乘法 表 的 程序 


图 13-12 所 示 则 是 一 个 稍微 复杂 的 例子 。 其 复杂 之 处 是 ， 内 层 循 环 次 数 取决 于 外 层 循环 中 的 
outer 值 。 即 内 层 循环 第 一 次 循环 次 数 为 0， 随 后 是 1 次 、2 次 ， 以 此 类 推 。 在 该 例 的 基础 上 ， 是 一 个 
更 富 挑战 性 的 练习 (参见 习题 13.6)。 

#include <stdio.h> 

int main() 
int sum = 0; /* Initial the result variable */ 
int input; /* Holds user input */ 


int inner; /* Iteration variables */ 
int outer; 


/* Get input */ 
printf("Input an integer: "); 
Scanf("$d", &input); 


/* Perform calculation */ 
for (outer s 1; outer <= input; outer++) 
for (inner = 0; inner < outer; inner«4) { 
sum += inner; 





图 13-12 — A (8 Mi E forff 3 E) EF 


236 13€ 


/* Output result */ 


printf ("The result is %d\n", sum); 





图 13-12 —^- ERKE fort AREF ( 续 ) 


13.3.3 do-while 循 环 


在 while 循 环 中 ， 条 件 测 试 总 是 在 循环 体 执 行 之 前 先 被 执行 。 所 以 ， 对 while 来 说 ， 完 全 存在 循 
环 次 数 仅 为 0 的 情况 ， 即 循环 体 一 次 也 不 被 执行 (条 件 一 开始 就 不 为 真 )。 下 面 ， 我 们 介绍 一 个 
while 语 句 的 变种 一 一 do-while ， 无 论 条 件 真 假 ， 它 至 少 执行 一 遍 循环 体 。 这 是 因为 ， 在 do-while 结 
构 中 ， 每 次 循环 体 执行 之 后 才 判 断 条 件 。 下 面 是 do-while 的 一 个 例子 : 

x= 0; 


do { 
printf("$d \n", x); 
1; 





X= XxX+ l; 
} while (x « 10); 


其 中 ， 每 次 循环 之 后 ， 测 试 条 件 “x < 10”"。 因 此 ， 无 论 x 是 否 小 于 10， 循 环 体 至 少 被 执行 一 次 。 而 
下 一 次 循环 是 否 能 够 被 执行 ， 则 取决 于 条 件 表达 式 的 值 是 否 为 非 零 值 。 该 代码 的 执行 输出 如 下 所 示 ， 

0123456789 

从 语法 结构 上 说 ，do-while 和 while 相 同 ， 都 由 两 部 分 组 成 ， 

op body: 

while (test); 

其 一 是 循环 体 (loop_body)， 是 一 个 简单 语句 或 复合 语句 其 二 是 条 件 表达 式 (test) ， 决 定 
了 下 一 次 循环 能 否 继续 。 

图 13-13 所 示 是 do-while 循 环 的 控制 流程 图 。 注 意 它 与 
while 流 程 图 之 间 的 细微 差别 ， 即 循环 体 和 条 件 测试 的 位 置 互 
换 。 条 件 分 支 的 返回 点 是 循环 体 ， 即 下 一 次 循环 的 开始 处 。 | loop body | 

至 此 ，C 语 言 的 三 种 循环 结构 已 介绍 完毕 ， 看 起 来 它们 


之 间 的 差别 很 小 ， 对 它们 的 选择 似乎 很 难 ， 但是， 一 旦 你 熟 F 
悉 了 它们 ， 并 掌握 了 一 定 的 编程 经 验 之 后 ， 做 出 选择 就 是 很 
容易 的 事情 。 虽 然 从 语义 上 说 ， 这 些 结构 是 等 价 的 ， 是 可 以 T 


互 换 的 ， 但 在 文法 上 ， 它 们 是 有 差别 的 ， 代 表 的 是 不 同 的 结 
构 含 义 ， 在 代码 阅读 上 ， 也 传递 了 不 同 的 编程 意图 。 


13.4 基于 控制 结构 的 问题 求解 


在 学 习 了 一 种 新 的 控制 结构 之 后 ， 下 面 我 们 开始 尝试 用 它们 来 编程 求解 问题 。 本 节 中 ， 我 们 
仍 将 使 用 “ 自 项 向 下 ”方法 求解 三 个 问题 ， 其 共同 之 处 在 于 ， 我 们 都 将 借用 C 的 控制 结构 来 编程 。 

有 效 编程 以 解决 问题 的 关键 ， 是 了 解 系统 的 基本 要 素 。 你 要 在 合适 的 时 候 ， 借 助 这 些 要 素来 
解决 其 中 的 难题 。 至 此 ， 我 们 已 学 过 的 C 语 言 系统 要 素 包括 : 三 种 基本 变量 类 型 及 其 运算 符 、 两 种 
判断 结构 和 三 种 控制 结构 。 


13.4.1 问题 1，r 的 近似 值 求解 
第 一 个 问题 是 ， 通 过 级 数 展开 式 ， 计 算 r 的 值 


图 13-13 do-while 语 名 的 疲 程控 制图 
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该 问题 的 关键 ， 实 际 上 是 根据 用 户 的 输入 ， 计 算 该 级 数 。 例 如 ， 用 户 输入 3 M 
求 4- 人 + 。 该 式 是 一 个 无 穷 级 数 ， 运 算式 的 项 数 越 多 ， 计 算 结果 就 越 接近 真实 r 值 。 

如 同 第 12 章 的 例子 ， 解 决 问题 的 第 一 步 任务 是 ， 确定 合适 的 数据 关 型 。 由 于 级 数 展开 过 程 中 ， 
涉及 小 数 处 理 。 所 以 ， 我 们 选用 double 类 型 浮 点 数 来 表示 计算 中 涉及 的 所 有 变量 。 而 从 问题 本 身 的 
属性 来 看 ， 这 也 是 最 佳 选择 。 

现在 ， 我 们 开始 问题 的 细 化 过 程 ， 将 粗略 的 算法 分 解 为 C 程 序 。 大 致 过 程 包括 ;程序 数据 的 初 
始 化 ， 然 后 是 读 取 用 户 输入 (级 数 展开 项 数 ) ， 随 后 是 根据 给 定 项 数 ， 计 算 级 数 展开 式 的 值 ， 最 后 
打印 输出 结果 。 如 图 13-14 所 示 ， 我 们 已 经 将 问题 从 定义 转换 成 一 个 顺序 结构 。 


+L 





采用 级 数 展开 





图 13-14 根据 给 定 级 数 展开 式 项 数 ， 计 算 r 近 似 值 的 程序 的 初始 分 解 


如 图 13-14 所 示 ， 上 顺序 结构 中 的 各 个 模块 都 比较 简单 ， 将 它们 翻译 为 C 代 码 应 该 是 件 容易 事 。 但 
对 于 个 别 结构 ， 还 有 待 进一步 细 化 ， 比 如 其 中 标识 为 “级 数 计算 ”的 模块 。 该 模块 的 要 点 是 ， 循 环 
处 理 级 数 式 的 每 个 项 数 ， 直 到 用 户 输入 指定 的 项 数 。 循 环 结构 可 采用 计数 器 控制 方式 。 图 13-15 所 
示 是 进一步 的 分 解 图 。 其 中 的 计数 器 (counter) 控制 着 循环 过 程 ， 如 果 计 数值 小 于 用 户 输入 值 ， 则 
继续 循环 。 注 意 ， 细 化 后 的 模块 结构 与 for 循 环 的 流程 图 很 相似 。 

现在 ， 距 离 成 功 已 经 不 远 了 ， 还 剩 一 个 模块 ,，“ 计 算 下 一 项 ”， 还 未 明确 。 我 们 发 现 ， 在 级 数 
展开 式 中 ， 所 有 的 偶数 项 都 是 减 操作 ， 而 所 有 的 奇数 项 都 是 加 操作 。 所 以 ， 在 该 模块 的 循环 处 理 
中 ， 我 们 需要 判断 当前 子 项 是 偶数 项 还 是 奇数 项 ， 然 后 将 因子 化 (1 或 -1) 后 的 子 项 累计 入 近似 值 
结果 中 。 因 此 ， 我 们 将 使 用 如 图 13-16 所 示 的 判断 结构 。 图 13-17 所 示 是 最 后 的 细 化 结果 所 对 应 的 完 
整 代 码 。 
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图 13-15 “级 数 计算 ”模块 的 循环 结构 细 化 。 通 过 循环 过 程 ， 计 算 级 数 展 开 式 得 到 r 








图 13-16 根据 当前 项 是 为 奇数 项 还 是 偶数 项 ， 来 决定 是 做 加 法 还 是 减法 
#include <stdio.h> 
int main() 
int count; /* Iteration variable 


int numOfTerms; Number of terms to evaluate 
double pi - 0; approximation of pi 


printf ("Number of terms (must be 1 or larger) : "); 
scanf("td", &numOfTerms); 


图 13-17 计算 x 值 的 程序 





Je 8j f H 239 


11 

12 for (count = 1; count <= numOfTerms; counte«) { 

13 if (count € 2) 

14 pi = pi + (4.0 / (2.0 * count - 1)); /* Odd term */ 


15 else 


16 pi = pi - (4.0 / (2.0 * count - 1)); /* Even term */ 
17 

18 

19 printf ("The approximate value of pi is *fWn", pi); 

20 





图 13-17 计算 r 值 的 程序 ( 续 ) 


13.4.2 问题 2， 找 出 100 以 内 的 质数 


下 面 进行 第 二 个 问题 的 求解 : 找 出 100 以 内 的 所 有 质数 。 所 谓 “ 质 数 ”(prime) ， 是 指 只 能 被 1 
和 它 本 身 整 除 的 整数 。 

同 前 面 例子 一 样 ， 求 解 的 第 一 步 〈 步 又 0) ， 是 为 该 问题 的 相关 数据 选择 合适 的 数据 类 型 。 由 
于 质数 概念 只 涉及 整数 ， 所 以 我 们 选择 整数 类 型 。 

下 一 步 就 是 逐步 细 化 ， 将 问题 最 终 转换 为 C 程 序 。 首 先 ， 我 们 将 问题 描述 为 一 个 单独 任务 ( 步 
UR1) ， 然后， 将 这 个 单独 任务 分 解 为 两 个 独立 的 子 任务 (步骤 2)， 一 是 “初始 化 ”， 二 是 “计算 ”。 

其 中 ,“ 计 算 ” 子 任务 是 整个 程序 的 关键 。“ 计 算 ” 子 任务 是 逐个 检查 从 2 到 100 的 数 ， 判 断 它 
是 否 为 质数 。 如 果 是 质数 ， 则 打印 输出 。 依 此 看 来 ， 计 数 器 类 型 的 循环 控制 结构 比较 合适 。 随 后 ， 
我 们 继续 细 化 “计算 ”模块 。 如 图 13-18 所 示 ， 细 化 后 的 流程 图 与 for 结 构 非常 相似 。 


步骤 1 


显示 100 以 内 


的 所 有 质数 








图 13-18 找 出 100 以 内 质数 的 问题 分 解 : 前 3 步 
现在 已 接近 C 代 码 阶段 了 ， 还 有 “判断 质数 ”这 个 子 任务 有 待 细 化 。 该 子 任务 是 ， 判 断 某 个 数 
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是 否 为 质数 。 在 此 ， 我 们 需要 引入 一 个 事实 : 如 果 一 个 介 于 2~100 的 整数 不 是 质数 ， 则 它 必 然 可 以 
被 2~10 范 围 内 的 某 个 数 整除 ， 且 该 数 不 是 它 本 身 。 基 于 这 个 判断 规则 ， 我 们 将 该 模块 细 化 为 如 图 
13-19 所 示 的 子 模块 。 对 于 任意 数 (2~100 范 围 内 ) ， 我 们 只 需 依次 判断 2~10 范 围 内 的 每 个 数 ， 是 否 
存在 能 被 它 整除 的 数 注意， 这 个 数 不 能 是 它 本 身 )。 如 果 不 存 在 ， 则 读数 就 是 质数 。 


以 2 到 10 除 Num 


CalcPrime 
设 有 除 
数 了 
如 果 Num 是 质 
数 ， 则 打印 输出 


图 13-19 分 解 CalcPrime 模 块 
最 后 ， 我 们 还 要 对 细 化 后 的 子 任务 “ 除 以 2~10 的 数 ” 做 进一步 的 细 化 。 这 需要 让 该 数 党 试 去 
除 以 2~10 中 的 每 个 数 。 显 然 ， 简 单 的 方法 又 是 计数 器 控制 方式 ， 如 图 13-20 所 示 。 








图 13-20 分 解 模块 “让 该 数 除 以 2 到 10 的 整数 ” 
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至 此 ， 我 们 终于 可 以 开始 编程 了 。 如 图 13-21 所 示 ， 程 序 包含 两 个 钳 套 的 for 循 环 。 外 层 的 循环 
遍历 是 2~100， 它 与 “计算 ” 子 任务 的 循环 对 应 。 内 层 循 环 的 任务 是 判断 该 数 是 否 为 质数 ， 它 与 子 
任务 “ 除 以 2~10 的 数 ”的 循环 对 应 。 


Kinclude <stdio.h> 
Hdefine FALSE 0 
#define TRUE 1 


int mainí) 


int num; 
int divisor; 
int prime; 


/* Start at 2 and go until 100 */ 
for (num = 2; num <= 100; num««) ( 
prime - TRUE; /* Assume the number is prime */ 


/* Test if the candidate number is a prime */ 
for (divisor = 2; divisor <= 10; divisor4*) 
if (((num $ divisor) -- 0) && num !- divisor) 
prime - FALSE; 


if (prime) 
printf ("The number $d is primeWMn", num); 
} 


) 





图 13-21 找 出 2 到 100 之 间 所 有 质数 的 程序 


注意 变量 prime， 在 每 次 内 层 循环 的 初始 ， 它 的 值 都 为 “ 真 "。 但 在 内 层 循 环 中 ， 一 旦 找到 能 
够 整除 的 数 〈 在 2~10 之 间 ) ， 则 标志 位 改 为 “ 假 " 。 换 名 话说 ， 如 果 内 层 循环 结束 时 ， 标 志 位 保持 
为 真 ， 则 意味 着 找到 一 个 质数 。 另 外 ， 为 方便 起 见 ， 我 们 还 使 用 了 C 语 言 的 预 处 理 宏 ( 即 #define) 
来 定义 符号 FALSE (代表 0) 和 TRUE (代表 1)。 


13.4.3 ”问题 3， 分 析 一 个 E-mail 地 址 


最 后 一 个 问题 是 ， 分 析 从 键盘 输入 的 E-mail 地 址 是 否 是 合法 地 址 。 所 谓 “ 合 法 地 址 ”， Eds. 
一 个 E-mail 地 址 字符 串 中 ， 字 符 串 中 必须 包含 “@ ”和 “.” 字 符 ， 且 “@” 符 号 必须 出 现在 “ 
前 面 。 

与 前 两 个 问题 一 样 ， 第 一 个 任务 (PRO) 是 选择 合适 的 数据 类 型 。 在 本 问题 中 ， 由 于 我 们 处 
理 的 是 文本 数据 ， 而 最 基本 的 文本 类 型 是 ASCII 码 ， 也 即 char 类 型 。 事 实 上 ， 对 应 输入 文本 的 最 住 
数据 类 型 是 字符 数组 (或 称 字符 串 )， 但 我 们 目前 还 未 介绍 过 “数组 ”这 种 类 型 (将 在 第 16 章 介绍 ) 。 
所 以 ， 我 们 暂 用 char 类 型 。 

下 面 是 问题 的 细 化 过 程 。 如 图 13-22 所 示 ， 我 们 先 将 问题 分 解 为 “输入 处 理 ” 和 “结果 输出 ” 
两 个 模块 (PURI). “结果 输出 ”模块 相对 简单 ， 即 将 已 被 检测 视 为 合法 的 E-mail 地 址 ， 打 印 输出 。 
只 是 “输入 处 理 ” 模 块 还 有 待 进一步 细 化 。 

有 关 “ 输 入 处 理 ” 模 块 的 细 化 〈 步 又 2) ， 由 于 我 们 选用 的 数据 类 型 是 字符 类 型 ， 所 以 每 次 读 
入 一 个 字符 ， 然 后 不 断 循环 ， 直 到 整个 E-mail 地 址 字符 串 结 束 。 该 循环 过 程 可 以 采用 “哨兵 条 件 ” 
的 控制 方法 。 如 步骤 2 所 示 ， 我 们 将 空格 或 换行 符 (Nn) 当做 “哨兵 "， 即 代表 E-mail 地 址 的 结束 

步骤 3 的 细 化 对 象 是 循环 体内 的 “下 一 字符 处 理 ” 模 块 。 在 循环 体 中 ， 对 E-mail 地 址 中 的 每 个 
字符 ， 我 们 都 要 检查 。 注 意 ， 我 们 的 检查 任务 中 ， 有 一 条 就 是 要 确认 字符 “@” 和 “.” 的 先后 顺 
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序 。 为 此 ， 我 们 使 用 两 个 变量 记录 相关 状态 。 在 循环 结束 之 时 ， 这 些 状 态 值 决 定 了 最 后 应 该 输出 
的 消息 。 


TZ 


FRI 


判断 是 否 是 “@” 
之 后 的 “” 符 号 


a À 
EE pd 
ü a 
X > 





图 13-22 分 析 E-mail 地 址 程序 的 逐步 细 化 


至 此 ， 我 们 离 最 后 的 C 代 码 已 经 不 远 了 。 注 意 ， 图 13-22 中 的 循环 结构 与 do-while 语 名 的 流程 图 
非常 相似 。 图 13-23 所 示 是 该 问题 最 终 对 应 的 C 代 码 。 


#include <stdio.h> 
#define FALSE 0 
#define TRUE 1 


int main() 


char nextChar; /* Next character in e-mail address */ 
int gotAt = FALSE; /* Indicates if At € was found */ 
int gotDot = FALSE; /* Indicates if Dot . was found */ 


OO -3 (y Ui £f Ut IN HR 


printf ("Enter your e-mail address: "); 


do ( 
scanf ("$c", &nextChar); 


if (nextChar == '@') 
gotAt = TRUE; 


if (nextChar == '.' && gotAt == TRUE) 
gotDot = TRUE; 


while (nextChar !- ' ' && nextChar !- 'NSn!); 


if (gotAt -- TRUE && gotDot -- TRUE) 
printf ("Your e-mail address appears to be valid.WXn"); 


else 
printf ("Your e-mail address is not valid!WMn"); 





图 13-23 判断 一 个 E-mail 地 址 是 否 合法 的 C 程 序 
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13.5 其 他 C 语 言 控 制 结 构 


最 后 ,我 们 对 C 语 言 的 控制 结构 做 一 些 补充 介绍 。 除 了 之 前 已 学 习 过 的 顺序 、 条 件 (if/if-else)、 
循环 (for/while/do-while) 等 基本 控制 结构 外 ， 下 面 我 们 将 介绍 switch、break 和 continue 这 三 种 语 
句 ， 它 们 能 为 程序 员 提供 特别 的 程序 流程 控制 功能 。 之 所 以 在 此 介绍 它们 ， 只 是 为 了 内 容 讲述 上 
的 完整 性 ， 而 在 本 书 其 他 例子 中 ， 都 不 再 使 用 这 三 种 结构 。 


13.5.1 switch f 


在 编程 中 ， 我 们 时 常会 遇 到 一 个 情况 ， 即 对 某 个 值 做 一 系列 的 测试 。 例 如 ， 在 如 下 代码 中 ， 
我 们 将 对 字符 变量 KkeyPress 做 一 系列 的 测试 ， 看 它 是 否 是 “a”、“b”、“x”、“y” 等 特定 字符 。 
char keyPress; 


if (keyPress == 'a' 
/* gtatement A = 


else if (keyPress == 'b') 
/* statement B * 


~ 


else if (keyPress == 
/* statement C */ 


else if (keyPress -- 'y') 
/* statement D */ 


其 中 ， 根 据 变 量 keyPress 的 值 ， 我 们 将 分 别 执行 标识 为 A、B、C、D 的 那些 语句 〈 也 可 能 一 个 
都 不 执行 )。 例 如 ， 如 果 keyPress 等 于 字符 “a”， 则 执行 语 名 A， 如 果 为 “b”， 则 执行 语句 B， 依 此 
类 推 。 如 果 keyPress 既 不 等 于 a、b， 也 不 等 于 x 或 y， 则 什么 语句 也 不 执行 。 

如 果 存 在 多 种 条 件 需 要 检查 ， 如 上 面 代码 所 示 ， 为 找到 与 变量 匹配 的 条 件 ， 最 坏 情 况 下 ， 所 
有 的 if 语 句 都 要 被 执行 一 遍 。 为 给 编译 器 一 个 优化 代码 的 机 会 ， 如 跳 过 其 中 的 某 些 测试 ， C 语 言 提 
供 了 switch 语 名 。 如 下 所 示 代 码 ， 它 的 行为 与 上 面 代 码 完 全 一 样 。 不 同 之 处 是 ， 这 里 用 的 是 switch 
语句 ， 而 不 是 一 连 串 的 if-else 语 句 。 

char keyPress; 

switch (keyPress) { 

ip statement A */ 

break; 

case 'b': 

/* statement B */ 
break; 

TU s statement C */ 

break; 

case 'y': 


/* statement D */ 
break; 


我 们 注意 到 ，switch 语 句 包 含 很 多 以 关键 字 case 开 头 的 行 ，case 之 后 是 一 个 标签 。 程 序 首先 执 
行 的 是 switch 语 句 ， 计 算 keyPress 的 值 ， 然后， 确定 与 该 值 匹配 的 case 标 签 ， 如 果 匹 配 ， 则 执行 
case 行 随后 的 语句 。 

下 面 仔 细 研 究 一 下 switch 语 名 的 结构 。 关 键 词 switch 指 示 的 是 一 个 “判断 表达 式 ”， 该 表达 式 
的 值 必须 是 “整数 类 型 ”( 如 int 或 char) 。 如 果 某 个 case 的 标签 值 与 该 表达 式 值 匹配 ， 则 程序 控制 权 
转移 至 该 case 标 签 后 面 的 语句 或 代码 块 。 每 个 case 行 之 后 ， 可 以 无 任何 语句 ， 也 可 以 由 多 个 语句 组 
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成 ， 如 同 复合 语句 一样 ， 只 是 不 需要 头 尾 分 界 的 大 括号 。 从 整个 switch 复 合 语句 来 看 ， 执 行 的 起 始 
点 是 标识 值 与 switch 表 达 式 值 匹 配 的 case 行 ， 而 不 是 从 第 一 个 case 就 开始 执行 。 一 个 Switch 结构 中 ， 
每 个 case 标 签 都 必须 是 惟一 的 ， 即 不 允许 出 现 相同 的 标签 。 

另外 ，case 标 签 的 内 容 必须 是 常量 或 常量 表达 式 ， 即 不 能 是 一 个 不 确定 的 、 会 随 着 程序 执行 而 
变化 的 值 。 例 如 ， 如 下 形式 就 是 不 合法 的 (因为 是 一 个 变量 ): 

Case 1: 

每 个 case 之 后 的 代码 块 ， 都 以 break 语 名 结尾 。break 的 作用 是 退出 switch 结 构 ， 即 将 程序 控制 
权 直 接 转 给 switch 尾 部 括号 之 后 的 那个 语句 。break 语 句 的 存在 ， 并 不 是 必需 的 。 如 果 没 有 break， 
则 程序 会 顺序 执行 ， 最 终 控 制 权 转移 给 下 一 个 case。 例 如 ， 如 上 面 代码 所 示 ， 将 代码 块 C 尾 部 的 
break 语 名 删除。 那么， 如 果 keyPress 与 case ‘x’ 匹配 ， 则 代码 段 C 和 D 都 会 被 执行 。 这 也 是 一 个 
编程 技巧 ， 但 通常 的 用 法 中 ，case 的 尾部 总 是 有 一 个 break 。 

另外 ， 还 有 一 种 默认 case 类 型 ， 即 default。 它 的 作用 是 ， 当 switch 表 达 式 值 与 任何 case 常 量 值 
都 不 匹配 时 ， 则 程序 控制 权 就 转交 给 default 后 面 的 语句 。 而 如 果 switch 结 构 中 没有 给 出 default 行 ， 
则 当 switch 表 达 式 值 与 所 有 case 常 量 都 不 匹配 之 时 ， 任 何 语句 都 不 执行 。 

注意 ， 从 语法 格式 上 来 说 ，switch 的 最 后 一 个 case 后 面 并 不 需要 break。 因 为 ， 无 论 如 何 ， 
switch 执 行 到 此 都 是 要 结束 的 。 但 是 ， 在 最 后 一 个 case 中 包含 break， 是 一 个 好 的 编程 习惯 。 例 如 ， 
你 又 要 添加 一 个 case 在 最 后 ， 则 不 用 挂念 着 为 前 一 个 case 后 面 补 上 break。 所 以 ， 保 证 每 个 case 后 面 
都 以 break 结 束 ， 是 一 个 安全 的 编程 习惯 。 


13.5.2 break 和 continue 语 名 


在 上 一 节 中 ， 我 们 介绍 了 在 switech 结 构 中 ， 怎 样 使 用 break 语 句 。 事 实 上 ， 在 循环 结构 中 ， 偶 
尔 也 会 使 用 break 语 句 及 continue 语 句 。 
break 的 作用 是 ， 让 编译 器 生成 一 个 提前 退出 循环 或 switch 结 构 的 代码 。 在 循环 体内 使 用 break， 
它 会 跳出 break 所 在 的 最 内 层 循 环 体 ， 即 结束 本 层 循 环 。 相 比 之 下 ，continue 语 句 的 作用 是 ， 让 编译 
器 生成 一 条 跳 转 指令 ， 提 前 至 下 一 次 循环 的 开始 。 这 些 语 名 可 以 出 现在 循环 体内 ， 且 仅 对 最 直接 
包含 它们 的 循环 结构 有 效 。 总 之 ，break 和 continue 的 本 质 作用 是 ， 让 编译 器 生成 一 个 无 条 件 跳 转 指 
令 ， 从 循环 体 当 前 位 置 直接 跳 转 至 代码 的 另 一 个 位 置 (如 循环 体外 或 循环 体 开始 处 )。 如 下 是 两 个 
例子 (break 和 continue ) : 
/* This code segment produces the output: 0 1 2 3 4 */ 
for (i = 0; i < 10; i++) 
if (i == 5) 
break; 
printf("$d ", i); 
/* This code produces the output: 0 12 3 4 6 7 8 9 */ 
for (i = 0; i < 10; i++) 
if (i == 5) 


continue; 
printf("$d ", i); 


13.5.8 简单 计算 器 的 例子 


如 图 13-24 所 示 的 程序 ， 与 第 10 章 的 计算 器 例子 相 比 ， 功 能 上 相同 。 先 是 提示 用 户 输入 三 个 参 
Wr. 操作 数 1、 运 算 符 、 操 作 数 2， 然 后 ， 对 两 个 操作 数 做 计算 (运算 符 ) ， 最 后 ， 输 出 计算 结果 。 
下 面 这 段 代 码 ， 将 采用 switch 语 句 ， 根 据 不 同 的 运算 符 进行 计算 。 
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#include <stdio.h> 









int main() 







int operandl, operand2; /* Input values */ 
int result = 0; /* Result of the operation  */ 
/* operation to perform */ 







char operation; 






/* Get the input values */ 









10 printf("Enter first operand: "); 

11 scanf("td", &operandl); 

12 printf ("Enter operation to perform (+, -, *, /]: "); 
13 scanf ("\n$c", &operation); 

14 printf ("Enter second operand: "); 

15 scanf ("%d", &operand2); 





/* Perform the calculation */ 
18 switch (operation) { 

19 case '+': 

20 result = operandl + operand2; 
break; 










^25. 


case 
24 result = operandl - operand2; 


break; 












case '*': 
28 result = operandl * operand2; 


break; 











case '/': 


32 if (operand2 !- 0) /* Error-checking code. */ 







33 result - operandl / operand2; 
34 else 
35 printf ("Divide by 0 error!Mn"); 






break; 






default: 
39 printf ("Invalid operation!\n"); 


40 break; 


) 


printf("The answer is &dWMn", result); 







图 13-24 计算 器 程序 


13.6 小 结 


我 们 总 结 一 下 本 章 的 几 个 关键 内 容 。 本 章 的 基本 目的 是 ， 学 习 C 语 言 的 几 种 控制 结构 ， 以 扩展 
我 们 用 C 语 言 求解 问题 的 方法 和 能 力 。 

“判断 结构 。C 语 言 有 两 种 基本 判断 语句 ，if 和 if-else。 它 们 能 根据 表达 式 值 的 真 假 ， 有 条 件 地 

控制 随后 要 执行 的 语句 。 

.循环 结构 。C 语 言 支持 三 种 循环 语句，while、for 和 do-while。 这 些 语句 的 特点 是 ， 不 断 反复 

地 执行 某 个 语句 或 一 段 代 码 ， 直 到 特定 条 件 表达 式 值 变 为 假 为 止 。 其 中 ，while 和 do-while 适 

合 “哨兵 条 件 ”控制 方式 ， 而 for 则 适合 计数 器 控制 方式 。 

， 基 于 控制 结构 求解 问题 。 在 前 几 章 学 过 的 编程 技能 的 基础 上 (如 C 语 言 的 3 种 基本 类 型 、 变 

量 、 运 算 符 及 printf 和 scanf 等 IO 操作 ) ， 本 章 又 增加 了 “控制 结构 ”的 编程 方法 。 最 后 ， 为 

熟悉 这 种 编程 方法 ， 我 们 练习 了 三 个 用 控制 结构 解决 问题 的 例子 ， 
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13.7 习题 


13.1 试 写 出 对 应 于 图 13-24 所 示 “ 计 算 器 程序 ”的 ， 由 LC-3 编 译 器 生成 的 符号 表 。 
13.2. 试 回答 以 下 问题 ， 
a. 如 下 这 段 代码 ， 预 编译 器 处 理 之 后 的 结果 是 什么 ? 
#define VERO -2 


if (VERO) 
printf("True!"); 

else 
printf("False!"); 


b. 该 代码 执行 后 的 输出 是 什么 ? 
c. 如 果 修 改 代码 如 下 ， 代 码 执行 后 与 之 前 的 结果 有 什么 不 同 ? 为 什么 ? 
"define VERO -2 


if (VERO) 
printf("True!"); 

else if (!VERO) 
printf("False!"); 


13.3 ”在 C 语 言 中 ，if-else 语 名 可 以 替代 条 件 运算 符 (12.6.3 节 )。 试 用 if-else 语 句 重 写 如 下 的 条 件 运 
算 符 语句 。 


x-a?b:c; 


13.4” 试 分 别 描述 如 下 语句 在 x<=0 和 x=1 两 种 情况 下 的 动作 。 
a. 
if (x = 0) 
printf("x equals 0\n"); 


else 
printf("x does not equal OWn"); 


b. 


if (x == 0) 
printf ("x equals OWn"); 
else 
printf("x does not equal OM"); 


C. 

if (x == 0) 
printf ("AM"); 

else if (x !- 1) 
printf ("BW"); 

else if (x « 1) 
printf ("Cin"); 

else if (x) 
printf ("Din") ; 


d. 
int X; 
int y; 


switch (x) ( 
Case 0: 
y= 3; 


case l1: 
y-4; 
break; 


default: 
y = 5; 
break; 


} 
e. 第 4 部 分 中 ， 如 果 x 不 等 于 0 或 1， 会 发 生 什么 ? 
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给 出 对 应 于 习题 13.4 第 4 小 题 的 Switch 语句 ， 由 LC-3 C 编 译 器 编译 之 后 所 生成 的 LC-3 代 码 。 


图 13-12 所 示 是 一 个 伴 套 for 循 环 的 C 程 序 。 试 回答 以 下 问题 : 
a. 试用 数学 方 靶 ， 分 析 该 程序 的 运算 级 数 (或 计算 复杂 度 ) ， 
b. 试 编写 程序 ， 计 算 如 下 函数 ， 

f(n) =f (n-1) + f (n-2) 


其 初始 条 件 为 : f (0)= 1,f(1)=1 


试问 ， 如 下 if-else 语 句 可 以 转换 成 Switch 语句 吗 ? 如 果 可 以 ， 请 转换 ， 如 果 不 可 以 ， 请 说 明 


理由 。 

if (x == 0} 
Y = 3; 

else if (x == 1) 
Y= 4; 

else if (x == 2) 
Y= 5; 

else if (x -- y) 
y= 6; 

else 
Y= T7; 


试问 ， 在 如 下 的 结构 中 ，loopBody 语 句 的 执行 次 数 分 别 是 多 少 ? 


a. 


while (condition) 
loopBody; 


b. 
do 
loopBody; 
while (condition); 
C. 


for (init; condition; reinit) 
loopBody; 


d. 


while (conditionl) 
for (init; condition2; reinit) 
loopBody; ` 
€. 
do 
do 
loopBody; 
while (condition1); 
while (condition2); 


试问 ， 如 下 各 代码 段 的 输出 分 别 是 什么 ? 


a. 

a = 2; 

while (a > 0) ( 
a--; 


) 
printf("Sd", a); 


b. 


a-22; 
do ( 
a--; 
) while (a > 0) 
printf("$d", a); 


C. 

b= 0; 

for (a = 3; a < 10; a += 2) 
b=b+ 1; 

printf ("%d $d", a, b); 
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13.10 ” 试 修改 如 图 13-4 所 示 程 序 ， 将 其 中 的 if-else 语 句 赫 换 为 switch 语 句 。 


13.11 


13.12 


13.13 


13.14 


13.15 


13.16 


试 对 图 13-23 所 示 的 “BE-mail 地 址 验证 ”程序 做 出 修改 ， 新 的 合法 性 验证 要 求 ， 在 E-mail 地 
址 字符 串 中 ， 符 号 @ 前 、 符 号 @ 和 .之 间 、 符 号 .之 后 ， 至 少 存在 一 个 字母 。 满 足 这 种 要 求 的 
E-mail 地 址 ， 才 认为 是 合法 的 。 

试 回答 以 下 问题 。 其 中 ，x 是 一 个 数值 为 4 的 整数 。 

a. 如 下 代码 的 输出 是 什么 ? 


if (7 >x » 2) 
printf("True."); 

else 
printf("False."); 


b. 如 下 代码 会 无 限 循 环 吗 ? 
while (x > 0) 


. 如 下 代码 执行 后 ，x 的 值 为 多 少 ? 
for (x = 4; x < 4; x--) { 
if (x « 2) 
break; 
else if (x -- 2) 
continue; 
x= -1; 


】 
试 对 如 下 代码 做 出 修改 ， 将 for 循 环 结构 替换 为 do-while 结 构 。 


int main(í) 


o 


int i; 
int sum; 
for (i = 0; i <= 100; i++) { 
if (i $ 4 == O0) 
sum = sum + 2; 
else if (i $ 4 == 1) 
sum - sum - 6; 
else if (i % 4 == 2) 
Sum - sum * 3; 
else if (i $ 4 == 3) 
sum = sum / 2; 


printf("€*dMn", sum); 


) 

试 编写 C 程 序 ， 读 取 整 数 输入 4*， 然 后 依次 输 册 各行。 其 中 ,第 1 行 是 1， 第 2 行 是 两 个 2， 第 
3 行 是 三 个 3，……， 直 到 最 后 一 行 的 个。 

例如 ， 输 入 为 5， 则 输出 如 下 : 


1 

2 2 

3 3 3 

4 4 4 4 

5 5 5 5 5 


a. 将 如 下 while 循 环 替换 为 for 结 构 语句 ， 


while (condition) 
loopBody; 


b. 将 如 下 for 循 环 替 换 为 while 结 构 语句 : 


for (init; condition; reinit) 
loopBody; 


试问 ， 如 下 代码 的 输出 结果 是 什么 ? 
int r 0; 

int s 
int w 
int sum - 0; 


Hon H 
eo 


for (r = 1; r <= w; r++) 
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for (8S = r; S <= W; S++) 
Sum = sum + S; 


printf ("sum =%d\n", sum): 
13.17 ”如 下 代码 看 起 来 有 些 特别 ， 试 描述 它 的 输出 应 该 是 什么 ? 
int i; 
Scanfí("$d", &i); 
for (j = 0; j < 16; j++) { 


i£ (i & (1 << j)) ( 
countt*; 


} 


printf ("$d\n", count); 


13.48 试 给 出 如 下 各 代码 段 的 输出 结果 。 


a. 
int x = 20; 
int y = 10; 


while ((x > 10) && (y & 15)) { 
Y=Y+1; 


x=x- 1; 
printf("*"); 
b. 
int x; 


for (x = 10; x ; X » x - 1) 
printf('*"); 


c. 
int x; 


for (x 3 0; x « 10; x - x « 1f 


if (x $ 2) 
printf("*'"); 
} 
d. 
int x = 0; 
int i; 


while (x > 10) { 
for (i = 0; i < x; i= x + 1) 
printf("*"); 
X -X-1; 


) 


第 14 章 BO X 


14.1 概述 


函数 就 是 子 程序 ， 而 子 程序 是 现代 编程 语言 的 灵魂 。 函 数 为 程序 员 提 供 了 一 种 编程 元 素 的 扩 
展 机 制 ， 是 对 程序 已 有 操作 符 和 结构 的 一 个 扩展 。 函 数 概念 非常 重要 ， 很久 以 前 它 就 已 成 为 程序 
语言 必 不 可 少 的 一 部 分 ， 所 有 类 型 的 指令 集结 构 ， 在 硬件 结构 上 都 提供 了 对 函数 的 直接 支持 ( 包 
括 LC-3)。 

函数 也 称 为 过 程 、 子 程序 或 方法 ， 它 们 都 是 一 个 意思 。 为 什么 函数 如 此 重要 ?因为 它 是 一 种 
“抽象 *， 即 通过 函数 ， 我 们 将 功能 与 实现 方法 相互 分 离 。 一 旦 创建 了 一 个 功能 模块 ， 并 理解 了 它 的 
结构 特性 ， 之 后 就 可 以 把 它 当做 一 个 现成 构件 而 直接 使 用 (不 必 细 究 它 的 实现 细节 )。 试 想 ， 如 果 没 
有 抽象 ， 构 建 计 算 机 这 样 一 个 复杂 系统 ， 以 及 开发 运行 在 计算 机 之 上 的 软件 ， 将 是 多 么 困难 的 事情 。 

函数 对 我 们 来 说 并 不 陌生 。 在 LC-3 汇 编 语 言 中 ， 我 们 就 学 习 和 使 用 了 多 种 不 同 的 函数。 从 语 
法 上 来 说 ，LC-3 的 汇编 子 程序 和 C 的 函数 有 所 不 同 ， 但 其 本 质 是 一 样 的 。 

C 语 言 是 一 个 非常 依赖 于 “函数 ”的 编程 语言 。 换 句 话 说 ， 本 质 上 ，C 程 序 就 是 函数 的 集合 。 
其 中 ,每 条 语句 都 属于 且 仅 属于 一 个 函数 。 所 有 的 C 程 序 ， 都 从 main 函 数 开始 执行 ， 并 结束 于 main。 
在 main 函 数 中 ， 文 可 以 调用 其 他 函数 ， 而 这 些 函 数 又 可 以 调用 更 多 的 函数 。 但 最 终 的 控制 权 终归 
会 返回 到 main。main 函 数 的 结束 ， 就 是 程序 的 终止 《假设 不 存在 其 他 意外 情况 造成 程序 的 永和 久 终 
止 ， 如 断 电 、 出 错 等 )。 

本 章 将 介绍 C 语 言 中 的 函数 。 我 们 从 一 些 简单 例 程 开始 ， 首 先 对 C 的 函数 调用 语法 有 个 感性 认 
iR, 然后， 讲述 函数 的 实现 方法 ， 以 及 为 确保 函数 正常 工作 ， 底 层 所 必须 实现 的 操作 ， 最 后 ， 将 
通过 问题 求解 ， 感 受 函 数 在 编程 中 发 挥 的 作用 。 


14.2 “C 语 言 中 的 函数 


下 面 是 一 个 非常 简单 的 C 函 数 例 程 。 图 14-1 中 ， 抑 数 PrintBanner 是 一 个 打印 横幅 (banner) 的 程序 。 
程序 从 main 函 数 开 始 执行 ， 随 后 调用 PrintBanner 函 数 在 显示 设备 上 ， 打 印 一 整 行 的 “=” 字 符 )。 


#include <stdio.h> 





void PrintBanner(); /* Function declaration */ 
int main() 


PrintBanner(); /* Function call 
printf("A simple C program. Mn"); 


OQ -J Oy Ui d£ QJ N) | 


PrintBanner(); 


) 


void PrintBanner () /* Function definition  */ 


printf ("===========================~\Nn"); 


图 14-1 使 用 函数 打印 标志 信息 的 C 程 序 
函数 PrintBanner 非 常 简单 ， 它 不 需要 从 调用 者 那里 获得 任何 输入 参数 ， 也 不 需要 向 调用 者 返 
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回 任何 结果 (例如 ， 不 需要 统计 打印 字符 的 个 数 )。 在 此 ， 我 们 称 main 函 数 为 调用 者 (caller), 
PrintBanner 为 被 调用 者 (callee), 


14.2.1 带 参 数 的 函数 
在 PrintBanrier 和 main 之 间 ， 没 有 信息 交互 ， 所 以 接口 看 起 来 非常 简单 。 但 通常 ， 我 们 总 会 在 
调用 者 和 被 调用 者 之 间 传 递 一 些 信息 。 所 以 ， 在 下 面 这 个 例子 中 ， 我 们 将 介绍 C 语 言 中 的 函数 之 间 
怎样 传递 信息 。 图 14-2 所 示 代 码 中 ， 有 一 个 带 形式 参数 9S (argument) 的 函数 Factorial。 
#include «stdio.h» 
int Factorial(int n); /*! Function Declaration !*/ 
int main() Definition for main x/ 


int number; Number from user */ 
int answer; Answer of factorial */ 


printf ("Input a number: "); Call to printf */ 
scanf ("%d", &number); Call to scanf */ 
answer = Factorial (number); /*1 Call to factorial 


printf("The factorial of $d is $dWMn", number, answer); 


int Factorial(int n) /*! Function Definition 


int i; /* Iteration count 
int result = 1; /* Initialized result 


<= n; i++) /* Calculate factorial 


for (i i 
result * i; 


result 


1; 


return result; /*! Return to caller 





图 14-2 计算 阶乘 的 C 程 序 


函数 Factorial 的 任务 是 计算 从 1 到 ”之 间 ， 所 有 整数 的 乘积 。 其 中 ，” 的 值 由 调用 者 (main 函数 ) 
提供 。 将 该 函数 的 功能 表示 为 计算 公式 ， 如 下 所 示 : 
factorial(n) 2n! 1x2x3x--xn 
其 中 ， 国 数 计算 结果 存 人 变量 result， 然 后 返回 给 调用 者 (通过 return 语 句 ) 。 我 们 说 ， 函 数 
Factorial 从 调用 者 那里 获得 了 一 个 整 型 参数 ， 并 且 返 回 一 个 整 型 结果 给 调用 者 。 在 此 例子 中 ， 
Factorial 的 返回 值 又 被 赋 给 了 调用 者 中 的 answer 变 量 (第 14 行 )。 
让 我 们 仔细 看 一 下 C 语 言 中 函数 调用 的 语法 格式 。 图 14-2 所 示人 代码 中 ， 有 4 行 是 我 们 感 兴 趣 的 : 
第 3 行 的 Factorial 函 数 声 明 ， 第 19 行 的 函数 定义 ， 第 14 行 的 Factorial 函 数 调 用 ， 第 27 行 的 Factorial 函 
数 返回 。 
1. 声明 
第 3 行 是 Factorial 函 数 的 声明 。 函 数 声 明 的 目的 是 什么 ?答案 是 ， 通 过 函数 声明 告诉 编译 器 函 
数 的 一 些 相关 属性 〈 如 同 变量 声明 一 样 ) 。 我 们 又 称 之 为 “函数 原型 ”(function prototype)。 函 数 
O 所谓 “形式 参数 ”(argument) ， 又 被 翻译 为 变 元 、 输 入 参数 等 ， 由 于 它 是 在 被 调用 时 刻 被 创建 的 变量 ， 并 
随 着 函数 的 结束 而 消失 《与 国 数 内 部 的 局 部 变量 相同 ) 。 与 局 部 变量 不 同 的 是 ， 它 具有 在 调用 者 和 被 调用 
者 之 间 传递 参数 的 作用 (而 局 部 变量 没有 此 作用 )， 所 以 我 们 认为 称 之 为 “形式 (临时 创建 的 ) 参数 ”更 
直观 。 一 一 译 者 注 
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声明 的 内 容 包 括 ， 函数 名 、 返 回 值 类 型 ， 以 及 输入 参数 列表 。 函 数 声明 语句 以 分 号 C) 结尾 。 

函数 返回 值 类 型 是 声明 语句 的 第 一 个 字段 。 该 类 型 可 以 是 任何 C 类 型 ， 如 int、char、double 等 ， 
它 描述 的 是 函数 将 产生 的 输出 结果 (惟一 的 ) 的 类 型 。 但 是 ， 并 不 是 所 有 函数 都 有 返回 值 ， 如 之 
前 例子 中 的 PrintBanner 函 数 。 如 果 一 个 函数 没有 返回 值 ， 我 们 称 它 的 返回 类 型 是 void， 它 传达 给 
译 器 的 意思 是 ,该 函数 不 返回 任何 结果 。 

第 二 个 字段 是 肾 数 名 。 函 数 名 可 以 是 任何 合法 的 C 标 识 符 。 函 数 名 的 选择 应 该 能 反映 该 函数 的 
一 些 行为 和 特性 。 例 如 ，Factorial 这 个 函数 名 ,一 看 就 知道 是 执行 数学 操作 “ 阶 和 来”(factorial)。 
另外 ， 一 个 好 的 命名 规范 ， 函 数 名 和 变量 名 之 间 应 该 有 所 区 别 。 如 本 书 中 ， 函 数 名 的 首 字母 都 是 
大 写字 母 ， 如 Factorial 。 

在 函数 的 声明 中 ， 也 描述 了 函数 所 需 的 输入 参数 (parameter) 的 类 型 和 顺序 ， 它 们 也 是 该 函 
数 期 望 从 调用 者 获取 的 参数 类 型 和 传 入 顺序 。 在 声明 时 ， 我 们 可 以 为 每 个 参数 指定 一 个 名 字 (但 
不 是 必要 的 )。 例 如 ， 函 数 Factorial 的 声明 语 名 中， 输入 参数 是 一 个 整数 值 ， 它 对 应 的 就 是 函数 内 
部 的 x。 有 的 函数 不 需要 任何 输入 。 例 如 ，PrintBanner 函 数 的 参数 列表 就 是 空 的 。 

2. 调用 

第 14 行 是 国 数 Factorial 的 调用 。 该 语句 表示 main 国 数 调用 了 国 数 Factorial。 但 是 在 Factorial 国 
数 执行 之 前 ，main 国 数 必 须 为 它 传递 一 个 整数 值 。 我 们 称 由 调用 者 传递 给 被 调用 者 的 这 些 数值 为 
“参数 5”(argument) 。 参 数 可 以 是 任何 合法 的 表达 式 ， 只 是 它们 的 类 型 必须 与 被 调用 者 所 需要 的 
类 型 相 匹 配 。 这 些 参 数 紧 随 在 被 调用 函数 名 后 面 的 圆 括号 里 。 例 如 ， 在 本 例 中 ，main 函 数 将 变量 
number 的 值 作 为 形式 参数 传 给 被 调用 者 ， 而 函数 Factorial 的 返回 值 则 赋 给 变量 answer。 

3. 定义 

从 第 19 行 开始 ， 是 定义 Factorial 函 数 的 代码 。 注 意 ， 定 义 中 的 第 一 行 语句 和 函数 声明 几乎 一 样 
〈 除 了 最 后 的 分 号 ) 。 国 数 名 后 面 括号 中 的 内 容 是 函数 的 正则 化 参数 列表 (formal parameter list), 
所 谓 “ 正 则 化 参数 列表 ”， 是 一 组 变量 的 声明 ， 每 个 变量 的 内 容 都 将 被 初始 化 为 调用 者 提供 的 对 应 
数值 。 例 如 ， 本 例 中 ， 第 14 行 调用 函数 Factorial 时 ， 形 式 参 数 " 的 内 容 将 被 初始 化 为 main 所 属 变量 
number 的 值 。 在 每 个 函数 被 调用 处 ， 调 用 者 传递 的 形式 参数 必须 与 正则 化 参数 列表 中 定义 的 参数 
类 型 和 顺序 相 匹 配 。 

之 后 的 大 括号 内 是 函数 体 (function body)。 在 函数 体 中 ， 包 含 的 是 函数 执行 时 所 需要 的 变量 
声明 和 语句 。 任 何在 大 括号 内 出 现 的 变量 ， 都 是 该 函数 的 局 部 变量 。 

值得 一 提 的 是 ， 在 C 语 言 中 ， 函 数 调 用 者 的 局 部 变量 对 被 调用 者 来 说 是 不 可 见 的 。 例 如 ， 
Factorial (被 调用 者 ) 无 法 直接 修改 (调用 者 main) 内 部 的 变量 number。 并 且 ， 函 数 调 用 时 ， 参 数 
传递 采用 的 是 “ 传 值 ”方式 。 

4. 返回 

第 27 行 语句 ， 是 将 控制 权 从 函数 Factorial 交 还 给 调用 者 (如 main)。 由 于 函数 Factorial 要 返回 
一 个 值 ， 所 以 关键 词 return 必 须 跟随 一 个 表达 式 ， 且 该 表达 式 的 类 型 必须 与 函数 声明 的 返回 值 类 型 
相 匹 配 。 例 如 ，Factorial 中 的 “return result;” 语 句 ， 它 将 result 中 存储 的 计算 结果 返回 给 调用 者 。 
通常 ， 带 返回 值 的 函数 体内 至 少 存在 一 个 return 语 名。 而 没有 返回 值 的 函数 (声明 为 void 的 函数 ) , 
不 需要 return 语 句 。 换 句 话 说 ， 在 这 类 函数 中 ，return 语 句 是 可 有 可 无 的 ， 只 要 最 后 一 条 语句 执行 
完 ， 控 制 权 就 可 以 立刻 交还 给 调用 者 。 

那么 ，main 函 数 如 何 返 回 呢 ? 它 的 返回 类 型 是 int (ANSI C 标 准 )， 但 是 我 们 在 例子 中 没有 发 
现 它 的 return 语 句 。 事 实 上 ， 按 照 严格 规范 ， 在 前 面 的 所 有 例子 中 ， 我 们 都 应 该 为 main 函 数 补 上 一 


号” 在 中 文中 ，argument 和 parameter 都 翻译 为 “参数 。 事 实 上 ， 两 者 的 差别 很 微妙 。-- 一 译 者 注 


3 A 253 


4& "return 0;” 语 句 。 在 C 语 言 中 ， 如 果 一 个 带 返 回 值 的 函数 没有 显 式 返 回 一 个 值 ， 则 将 最 后 一 条 
语句 的 执行 结果 返回 给 调用 者 。 由 于 我 们 通常 忽略 main 示 数 的 返回 值 (main 函 数 因为 不 能 ) ， 所 以 ， 
为 简洁 起 见 ， 我 们 通常 省 略 这 条 return 语 句 。 

下 面 ， 我 们 总 结 一 下 上 述 各 语法 : 函数 声明 (或 原型 ) 的 作用 是 ， 向 编译 器 传递 函数 信息 
(函数 名 、 参 数 (来 自 调 用 者 ) 的 类 型 和 顺序 、 返 回 值 的 类 型 等 ) ， 函 数 定义 是 该 函数 真正 的 源 代 
码 。 定 义 中 包含 有 正则 化 参数 列表 ， 即 各 个 参数 的 名 字 和 顺序， 函数 的 激活 方式 是 函数 调用 。 被 
传人 的 各 形式 参数 值 包含 在 函数 调用 的 圆 括号 内 ， 它 们 将 按照 定义 顺序 ， 将 返回 值 传递 给 函数 定 
义 的 各 参数 ， 即 第 1 个 值 赋 给 第 1 个 参数 、 第 2 个 值 赋 给 第 2 个 参数 ， 依 此 类 推 ， 返 回 值 是 函数 的 输 


出 ， 传 给 函数 调用 者 。 


14.2.2 求解 圆 面积 


如 图 14-3 所 示 ， 我 们 将 进一步 讲述 C 函 数 的 语法 。 该 程序 的 任务 是 计算 圆 环 的 面积 (大圆 中 间 
控 掉 一 个 小 圆 ) 。 换 名 话说 ， 我 们 所 要 做 的 事情 是 ， 计 算 外 半径 和 内 半径 这 两 个 圆 面积 ， 然 后 相 减 。 
本 程序 中 ， 我 们 编写 了 一 个 计算 给 定 半 径 的 加 面积 的 函数 AreaOfCircle， 该 函数 有 一 个 double 类 型 
参数 ， 返 回 值 也 是 一 个 double 类 型 结果 。 
#include <stdio.h> 


/* Function declarations */ 
double AreaOfCircle (double radius); 


int main() 


double outer; /* Inner radius */ 
double inner; /* Outer radius */ 
double areaOfRing; /* Area of ring */ 


i 0 -20U0U Np 


printf("Enter inner radius: "); 
scanf ("51f", &outer ); 


printf("Enter outer radius: "); 
scanf ("$1f", &inner ); 


areaOfRing s AreaOfCircle(outer) - AreaOfCircle (inner); 
printf("The area of the ring is %f\n", areaOfRing); 


/* Calculate area of circle given a radius */ 
double AreaOfCircle(double radius) 


double pi = 3.14159265; 


return pi * radius * radius; 





图 14-3 计算 圆 环 的 面积 的 C 程 序 


再 次 提醒 ， 注 意 下 面 这 段 论 述 : 当 函 数 AreaOfCircle 执 行 时 ， 它 可 以 看 到 并 修改 局 部 变量 pi 和 
参数 radius。 但 是 ， 它 不 能 修改 任何 main 函 数 体 内 的 变量 (返回 值 除外 )。 

函数 AreaOfCircle 与 之 前 例子 略 有 不 同 。 在 main 函 数 中 ， 兽 多 次 调用 AreaOfCircle。 在 此 ， 
AreaOfCircle 扮 演 的 是 一 个 基本 运算 哥 作 (这 也 是 函数 的 优点 之 一 ) 。 从 更 大 的 层面 上 来 看 ， 实 际 
程序 中 存在 这 样 一 些 函 数 ， 它 们 会 在 上 百 甚至 上 千 个 地 方 被 调用 。 所 以 ， 将 如 AreaOfCircle 这 样 的 
基本 操作 封装 成 函数 ， 无 疑 大 大 缩减 了 代码 占用 的 空间 ， 并 下， 这 样 也 大 大 方便 了 代码 维护 ， 同 
时 也 使 程序 结构 更 加 清晰 。 与 直接 内 嵌 (embedded in-line) 方法 相 比 ， 使 用 AreaOfCircle 方 式 使 得 


代码 意图 更 加 明显 。 
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有 人 或 许 记 得 12.6.2 节 中 有 关 “ 常 数值 ”的 讨论 。 在 第 25 行 中 ， 我 们 “应 该 ”将 变量 pi 修饰 为 
const 类 型 ， 但 这 里 却 没有 。 这 是 因为 ， 我 们 希望 没有 读 过 第 12 章 的 读者 也 能 看 懂 这 个 例子 。 


14.8 C 语 言 中 函数 的 实现 


下 面 介绍 C 语 言 函数 的 底层 实现 原理 。C 函 数 与 LC-3 中 的 子 程序 (第 9 章 ) 是 等 价 的 ， 它 们 的 
核心 操作 完全 相同 。 在 C 语 言 中 ， 函 数 调 用 包括 三 个 基本 步骤 : (1) WA: 调用 者 将 参数 传递 给 被 
调用 者 ， 并 交 出 控制 权 ， (2) 执行 : 被 调用 者 执行 任务 ， (3) 被 调用 者 返回 函数 结果 ， 并 将 控 
制 权 交 还 给 调用 者 。 在 调用 机 制 的 实现 中 ， 有 一 个 重要 原则 ， 即 函数 必须 是 与 “调用 者 无 关 的 ”。 
换 句 话说， 一 个 函数 可 以 被 不 同 的 调用 者 调用 (所 以 函数 实现 中 ， 不 能 对 调用 者 附加 任何 前 提 假 
设 )。 在 本 节 中 ， 我 们 将 以 LC-3 为 例 ， 讲 述 该 过 程 的 实现 。 


14.3.1 运行 时 栈 


我 们 需要 研究 一 种 机 制 ， 在 函数 被 调用 时 , “激活”(activate) 被 调用 函数 。 换 句 话 说 ,在 函 
数 被 执行 前 ， 我 们 必须 在 内 存 中 ， 为 该 函数 的 局 部 变量 分 配 空间 。 解 释 如 下 : 

每 个 函数 对 应 一 个 存储 它 的 局 部 变量 的 内 存 模板 (memory template)。 回 顾 12.5.2 节 中 的 论述 ， 
函数 的 活动 记录 ， 是 指 内 存 中 存储 函数 局 部 变量 的 一 个 模板 。 函 数 中 被 声明 的 每 个 局 部 变量 ,在 
活动 记录 中 都 占有 一 个 位 置 。 帧 指针 (frame pointer, R5) 标识 的 是 活动 记录 的 起 始 地 址 。 问 题 是 ， 
活动 记录 在 内 存 的 什么 地 方 ?. 该 问题 的 答案 有 以 下 两 种 选择 : 

(1) 方案 1 一 一 编译 器 负责 为 每 个 函数 分 配 存放 活动 记录 的 地 方 。 例 如 ， 函 数 4 的 活动 记录 在 
地 址 X 处 ， 函 数 8 的 活动 记录 在 地 址 7 处 ， 依 此 类 推 。 当 然 ， 在 这 种 方式 下 ， 各 函数 的 活动 记录 之 间 
相互 不 重 又 。 这 种 管理 分 配方 法 ， 看 起 来 简单 明了 ， 但 存在 一 系列 的 限制 。 例 如 ， 在 函数 4 中 ， 再 
次 调用 它 自 己 ( 还 是 函数 4) 时 , 结果 如 何 ? 我 们 称 这 种 情况 为 “递归 ”(recursion) ( 详 见 第 17 章 )。 
如 果 国 数 4 调 用 了 它 自 己 ， 显 然 被 调用 者 4 的 局 部 变量 将 覆盖 调用 者 4 的 活动 记录 空间 ， 结 果 程 序 出 
现 异常 。 所 以 ， 对 于 像 C 语 言 这 样 支持 递归 的 编程 语言 ， 方 案 1 是 失败 的 。 

(2) 方案 2 一 一 函数 每 被 调用 一 次 ， 就 为 它 在 内 存 中 分 配 一 个 活动 记录 空间 。 函 数 返 回 时 ， 则 
将 该 活动 记录 空间 返还 ， 以 供 其 他 函数 调用 时 使 用 。 这 种 方案 看 起 来 比方 案 1 复 杂 ， 但 允许 函数 递 
归 操 作 。 由 于 每 次 调用 (invocation) 函数 时 ， 都 将 在 内 存 中 为 其 分 配 一 个 存储 局 部 变量 的 空间 。 
所 以 ， 如 果 函 数 4 调 用 它 自己 ， 则 被 调用 者 4 有 自己 的 活动 记录 空间 ， 而 该 记录 空间 与 调用 者 A 的 活 
动 记 录 空 间 是 不 一 样 的。 此 外 ， 如 下 机 制 可 进一步 降低 方案 2 的 复杂 性 ， 采 用 数据 结构 “ 栈 ”， 可 
以 方便 地 跟踪 函数 调用 模式 (函数 4 调用 函数 8，B 又 调用 C)， 如 下 例 所 示 。 

图 14-4 所 示 代 码 中 ， 包 含 三 个 函数 : main、Watt 和 Volta。 至 于 每 个 函数 的 任务 是 什么 ， 对 本 
例 来 说 并 不 重要 (我 们 所 关心 的 是 其 调用 模式 ) ， 所 以 我 们 删 掉 了 其 中 的 一 些 细节 代码 。 其 中 ， 
main 调 用 Watt，Watt 又 调用 Volta， 之 后 ， 控 制 权 返回 main， 再 之 后 ，main 又 调用 Volta。 

int main() 


int a; 
int b; 


b = Watt(a); /* main calls both */ 
b = Volta(a, b); 


} 


int Watt (int a) 


图 14-4 体现 函数 调用 的 栈 特性 





int w; 


w - Volta(w, 10); /* Watt calls Volta */ 


return w; 


int Volta(int q; int r) 
int k; 
int m; 


: /* Volta calls no one */ 
return k; 


) 





图 14-4 体现 函数 调用 的 栈 特性 (55) 


在 每 个 函数 中 ， 都 有 自己 的 活动 记录 (包括 局 部 变量 、 暂 存 信息 以 及 调用 者 传人 的 形式 参数 )。 函 
数 被 调用 时 ， 我 们 都 将 采用 一 种 类 似 栈 的 形式 ， 在 内 存 中 为 该 活动 记录 分 配 一 个 空间 。 如 图 14-5 所 示 。 


x0000 
内 存 
x R6 
R6 R5 
R5 
xFFFF 


a) 执 行 开 始 的 栈 状 态 ” b) 子 程序 Watt 开 始 执 行 时 c) 子 程序 Volta 执 行 时 











d) 子 程序 Volta 完 成 之 后 e) 子 程序 Watt 完 成 后 人 ) 子 程序 Volta 执 行 时 
图 14-5 图 14-4 所 示 程 序 在 运行 时 的 栈 空间 快照 


其 中 ， 每 个 阴影 区 代表 一 个 特定 函数 的 活动 记录 。 上 面 这 组 图 示 ， 演 示 了 各 函数 在 调用 和 返回 时 ， 
运行 时 栈 空间 动态 增长 和 缩小 的 情况 。 注 意 ， 将 数据 项 压 入 栈 时 ， 栈 顶 总 是 向 着 低 的 内 存 地 址 方 
向 移动 ， 但 我 们 称 之 为 “增长 ”。 

图 14-5a 所 示 是 程序 刚 开始 的 栈 快照 。 由 于 程序 的 开始 是 main， 所 以 栈 上 分 配 的 是 main 的 活动 
记录 。 图 14-5b 所 示 是 main 调 用 Watt 之 后 的 栈 快照 。 注 意 ， 活 动 记录 的 分 配 也 是 栈 风 格 的 ， 即 函 数 
调用 时 ， 活 动 记录 入 栈 ， 函 数 返 回 时 ， 活动 记录 出 栈 。 图 14-5c~f 所 示 ， 是 栈 在 代码 运行 的 不 同时 
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刻 的 快照 。 其 中 ，R5 总 是 指向 当前 活动 记录 的 某 个 位 置 〈 局 部 变量 的 起 始 地 址 ) ，R6 总 是 指向 运行 
时 栈 顶 (所 以 ， 又 称 它 为 栈 指针 )。 总 之 ， 这 些 寄 存 器 在 运行 时 栈 以 及 C 语 言 的 函数 实现 中 ， 都 扮 


演 着 非常 关键 的 角色 。 


14.3.2 实现 机 制 

很 显然 ， 函 数 调用 时 ， 底 县 有 很 多 事情 要 做 ， 形式 参数 传道、 活动 记录 的 入 栈 和 出 栈 、 控 制 
权 在 函数 之 间 的 转交 。 这 些 工作 ， 有 的 是 由 调用 者 负责 ， 有 的 是 由 被 调用 者 负责 。 

完成 这 些 工作 的 先后 步骤 是 : (1) 调用 者 将 参数 拷贝 到 被 调用 者 所 能 访问 的 内 存 区 域 。(2) 
被 调用 函数 的 开始 代码 ， 将 活动 记录 压 入 栈 ， 并 在 栈 中 保存 一 些 备 忘 (bookkeeping) 信息 (以 保 
证 控制 权 返 回调 用 者 后 ， 调 用 者 的 原 局 部 变量 和 寄存 器 内 容 在 调用 前 后 没有 变化 )。(3) 被 调用 者 
完成 自己 的 工作 。(4) 被 调用 函数 完成 之 后 ， 将 活动 记录 出 栈 ， 并 将 控制 权 返 回调 用 者 。(5) W 
用 者 重 获 控制 权 后 ， 读 取 被 调用 者 的 返回 值 。 

下 面 ， 我 们 来 看 看 执行 这 些 操作 的 LC-3 代 码 。 例 如 ， 图 14-4 中 第 18 行 所 示 的 函数 调用 语句 : 

w = Volta(w, 10); 

该 语句 对 应 的 LC-3 代 码 如 下 所 述 。 

1. 调用 

在 “w = Volta(w, 10);” 语 句 中 ，Volta 的 形式 参数 有 两 个 ,返回 值 赋 给 本 地 整 型 变量 w。 在 将 
该 语句 翻译 为 LC-3 代 码 的 过 程 中 ， 编 译 器 做 了 如 下 工作 : 

(1) 通过 将 两 个 参数 值 压 人 运行 时 栈 ， 向 函数 Volta 传 递 参 数 。 另 外 ， 由 于 R6 总 是 指向 运行 时 
栈 的 顶部 〈 即 当前 运行 时 栈 顶 数 据 所 在 的 地 址 ) ， 所 以 ， 每 向 栈 中 压 人 一 个 数据 项 ， 首 先是 递减 
R6 值 ， 然 后 将 数据 存 人 R6 指 向 的 地 址 。 在 LC-3 结 构 中 ，C 函 数 的 参数 ， 按 照 它们 在 国 数 调用 中 的 
顺序 ， 从 右 到 左 依次 被 压 人 栈 。 在 此 ， 即 意味 着 先 压 人 数值 10 (最 右边 ) ， 然 后 是 w 的 值 。 

(2) 通过 JSR 指 令 ， 把 控制 权 传 给 函数 Volta。 

晤 数 凋 用 操作 的 LC-3 代 码 如 下 所 示 


RO, RO, #0 ; RO <- 0 
ADD RO, RO, #10 ; RO <- 10 


+ 
STR RO, R6, HO ; Push 10 
LDR RO, R5, 40 ; Load w 
; 
STR RO, R6, #0 ; Push w 


JSR Volta 


图 14-6 所 示 是 如 上 指令 执行 后 ， 运 行 时 栈 的 变动 情况 。 其 中 , 参数 压 人 的 位 置 是 调用 者 (Watt) 
的 活动 记录 空间 ， 而 被 调用 者 (Volta) 的 活动 记录 则 在 调用 者 活动 记录 之 上 。 





图 14-6 WwWatt 把 它 要 传递 给 Volta 的 参数 压 入 运行 时 栈 
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2. 被 调用 函数 的 开始 

紧 随 JSR 指 令 (Watt) 之 后 的 第 一 条 指令 ， 是 函数 Volta 中 的 第 一 条 指令 。 

被 调用 函数 的 初始 代码 ， 要 完成 与 调用 信息 相关 的 备份 操作 : 

第 一 个 操作 就 是 为 返回 值 预 留 一 个 内 存 位 置 ， 即 通过 栈 指 针 递减 ， 将 一 个 内 存 空间 “ 压 ” 人 和 人 
栈 。 之 后 ， 被 调用 函数 在 返回 调用 者 之 前 ， 将 返回 值 填 和 人 此 内 存 。 

随后 ， 是 调用 者 相关 的 信息 的 保存 。 使 得 函数 完成 后 ， 调 用 者 能 够 顺利 重 获 程 序 控制 权 。 事 
实 上 ,就 是 保存 R7 中 调用 者 的 返回 地 址 (为 什么 是 R7? 参考 JSR 指 令 ), 以 及 R5 中 调用 者 的 帧 指针 。 
备份 调用 者 的 帧 指针 非常 重要 ， 我 们 有 时候 又 称 “ 帧 指针 ”为 “动态 链 ”(dynamic link)， 它 是 保 
证 调用 者 在 重 获 控制 权 后 ， 能 恢复 对 局 部 变量 访问 的 关键 。 换 名 话说 ， 无 论 是 返回 地 址 还 是 动态 
链 被 破坏 ， 都 会 造成 控制 权 返 回 给 调用 者 操作 的 失败 。 所 以 ， 这 两 个 备份 信息 非常 重要 。 

最 后 一 个 操作 是 ， 被 调用 者 通过 调整 K6 的 值 ， 在 栈 空间 中 为 它 的 局 部 变量 分 配 足 够 空间 ， 同 
时 设置 R5 指 向 这 些 局 部 变量 的 基地 址 。 

总 结 一 下 ， 下 面 是 被 涯 用 函数 在 执行 之 初 所 做 的 各 种 操作 : 

(1) 为 返回 值 预 留 空间 。 返 回 值 在 形式 参数 空间 的 上 方 。 

(2) 将 R7 的 内 容 (返回 地 址 ) 压 入 栈 。 

(3) 将 R5 的 内 容 (动态 链接 ， 即 调用 者 栈 指针 ) EA. 

(4) 在 栈 空间 中 ， 为 被 调用 者 自己 的 局 部 变量 留 出 空间 。 设 置 R5 指 向 局 部 变量 空间 的 基地 址 ， 


R6 指 向 栈 顶 部 。 
cx LE. . 一 

Volta 所 完成 的 如 上 工作 ， 如 下 面 代码 所 示 : 

Volta: 
ADD R6, R6, #-1 ; Allocate spot for the return value 
ADD R6, R6, #-1 ; 
STR R7, R6, #0 ; Push R7 (Return address) 
ADD R6, R6, #-1 ; Push R5 (Caller's frame pointer) 
STR R5, R6, #0 ; We call this the dynamic link 
ADD R5, R6, 4-1 ; Set new frame pointer 


ADD R6, R6, id-2 ; Allocate memory for Volta's locals 

图 14-7 所 示 总 结 了 到 目前 为 止 ， 代 码 对 内 存 所 做 的 修改 。 其 中 ，Watt 和 Volta 的 活动 记录 布局 
非常 明显 。 注 意 ，Volta 活 动 记录 中 的 有 些 条 目 是 由 Watt 填 写 的 ， 即 Volta 活 动 记录 的 参数 区 。 共 中， 
第 一 个 参数 是 Watt 局 部 变量 w 的 值 ， 第 二 个 参数 是 数值 10。 它 们 入 栈 的 顺序 是 从 右 到 左 ， 所 以 w 在 
10 的 上 面 。 在 Volta 函 数 中 ， 将 通过 名 为 qa 和 ! 的 变量 引用 这 两 个 数值 。 问 题 是 ，Volta 自 己 的 局 部 变 
量 的 初始 值 应 该 是 多 少 ? 回顾 第 11 章 9 所 提 到 的 ， 局 部 变量 的 初始 值 是 不 确定 的 。 习 题 14.10 就 是 
有 关 局 部 变量 初始 值 的 。 | 

其 中 ， 栈 空间 中 的 每 个 活动 记录 ， 其 结构 布局 都 相同 ， 即 都 由 函数 局 部 变量 、 备 份 信 息 GR 
回 地 址 和 动态 链 ) 、 返 回 值 以 及 参数 等 内 容 组 成 。 

3. 被 调用 函数 的 结束 

在 被 调用 函数 完成 之 后 ， 返 回调 用 者 之 前 ， 还 必须 完成 一 些 操作 。 一 是 填写 返回 值 ， 以 传递 
给 调用 者 ， 二 是 让 出 活动 记录 所 占用 的 内 存 空 间 。 详 细 过 程 如 下 所 示 ， 

(1) 如 果 存 在 返回 值 ， 则 填写 活动 记录 的 返回 值 字段 。 

(2) 将 局 部 变量 “ 弹 ” 出 栈 。 

(3) 恢复 原 动 态 链 内 容 。 


O ”有关 “局 部 变量 的 初始 值 "， 应 该 是 在 第 12 章 (而 不 是 第 11 章 )。 一 译 者 注 
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(4) 恢复 返回 地 址 。 
(5) 通过 RET 指 令 ， 返 回调 用 者 。 


x0000 






R6 
R5 






main i& T [3 p ere 
main 函 数 的 返回 值 “ 







watt 函 数 的 活动 


- 


图 14-7 Volta 的 活动 记录 压 入 栈 后 的 运行 时 栈 
Volta 所 完成 的 以 上 操作 ， 如 下 面 的 LC-3 指 令 所 示 ; 


LDR RO, RS, #0 ; Load local variable k 
STR RO, R5, #3 ; Write it in return value slot 








xFFFF 


ADD R6, R5, #1 ; Pop local variables 


LDR R5, R6, #0 ; Pop the dynamic link 
ADD R6, R6, #1 ; 


LDR R7, R6, #0 ; Pop the return address 
ADD R6, R6, #1 ; 


RET 


其 中 ， 前 两 条 指令 的 任务 是 将 返回 结果 (变量 k 的 内 容 ) 填 人 Volta 活 动 记录 的 返回 值 字段 ， 然 
后 ， 通 过 移动 栈 指针 ,“ 弹 ”出 局 部 变量 ， 恢 复 动态 链 ， 恢 复 返 回 值 ， 最 后 ， 返 回调 用 者 。 

值得 一 提 的 是 ， 虽 然 我 们 说 将 Volta 的 活动 记录 “ 弹 ” 出 栈 ， 但 这 些 内 容 仍然 留 在 原 内 存 位 
置 上 。 

4. 返回 调用 函数 

被 调用 函数 执行 RET 指 令 之 后 ， 控 制 权 回 到 调用 函数 。 有 关 返 回 值 的 处 理 ， 在 有 些 情况 下 是 
设 有 返回 值 的 ( 即 被 调用 函数 的 声明 是 void 类 型 )， 而 有 些 情况 下 ， 有 返回 值 ， 却 被 忽略 ， 再 就 是 ， 
如 我 们 的 程序 所 示 ， 将 返回 值 由 调用 函数 存 人 变量 (Watt 的 局 部 变量 w)。 

具体 来 说 ,执行 以 下 两 个 操作 : 

(1) 将 返回 值 (如 果 有 ) 出 栈 。 

(2) 参数 出 栈 。 

JSR 之 后 的 LC-3 代 码 如 下 所 示 : 
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Eo * 
JSR Volta 
LDR RO, R6, #0 ; Load the return value 
; at the top of stack 
STR RO, R5, 40 ; w = Volta(w, 10); 
ADD R6, R6, #1 ; Pop return value 
ADD R6, R6, #2 ; Pop arguments 
一 旦 完成 这 些 代码 ， 则 整个 函数 调用 过 程 就 算 结 束 了 。 之 后 ， 调 用 者 恢复 原 正常 执行 过 程 。 


注意 ， 由 于 在 返回 调用 者 之 前 ， 被 调用 者 已 恢复 调用 者 的 执行 环境 ， 所 以 ， 对 调用 者 来 说 ， 已 没 
有 多 少 工作 要 做 (除了 从 栈 中 获取 返回 值 )。 

5. 调用 规则 

最 后 ， 我 们 讨论 一 个 一 直 避 而 不 谈 的 话题 。 在 函数 执行 过 程 中 ，R0~R3 的 作用 是 存放 计算 
中 的 临时 值 ，R4~R7 默 认为 系统 功能 ， R4 指 向 全 局 数据 区 段 ，R5 为 帧 指针 ，R6 为 栈 指针 ，R7 为 
返回 地 址 。 换 句 话 说 ， 孙 数 在 执行 时 ， 亏 数 调 用 规则 对 R4~R7 都 有 明确 的 使 用 规定 (它们 的 内 
容 要 么 不 变 ， 要 么 按照 预定 的 方式 改变 ) 。 那 么 寄存 器 RO、R1、R2 和 R3 怎 么 处 理 呢 ? 一 般 情况 
下 ， 我 们 要 保证 被 调用 函数 不 会 改变 它们 的 内 容 。 为 实现 这 一 点 ， 调 用 规则 可 以 采用 如 下 两 种 
方法 :(1) 调用 者 负责 将 它们 存 人 自己 的 活动 记录 区 (保存 它们 的 值 )， 我 们 称 这 种 方法 为 “ 调 
用 者 保存 ”规则 (参见 第 9 章 对 该 问题 的 讨论 )。 函 数 返 回 时 ， 调 用 者 再 将 它们 弹出 栈 ， 恢 复 它 
们 的 值 ，(2) 另 一 个 方法 是 ， 被 调用 者 负责 在 活动 记录 区 的 备份 字段 添加 4 个 字段 ， 以 保存 这 
些 寄存 器 的 值 ， 我 们 称 这 种 方法 为 “被 调用 者 保存 ”(callee-save) 规则 。 被 调用 函数 在 初始 化 
阶段 ， 将 RO~R3 与 R5、R7 的 内 容 一 起 保存 在 备份 字段 中 ， 然 后 在 返回 前 恢复 这 些 寄存 器 的 值 。 


14.3.3 汇总 

如 图 14-8 所 示 ， 我 们 将 Watt 的 函数 调用 及 Volta 函 数 的 开始 和 结尾 代码 (LC-3)， 全 部 放 在 一 起 。 
它们 是 前 几 节 LC-3 代 码 的 汇总 ， 展 示 了 代码 的 整体 结构 。 只 是 这 段 代码 比 之 前 的 代码 稍 做 了 优化 ， 
例如 ， 我 们 将 与 返回 值 的 压 入 和 弹出 相关 的 栈 指 针 R6 的 操作 ， 合 并 到 一 个 指令 中 。 


; RO <- 0 
; RO «- 10 


; Push 10 
; Load w 


; Push w 


; Load the return value at top of stack 
; w= Volta(w, 10); 
; Pop return value, arguments 


; Push return value 

; Push return address 

; Push R5 (Caller's frame pointer) 

; We call this the dynamic link 

; Set new base pointer 

; Allocate memory for Volta's locals 


; Volta performs its work 
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; Volta performs its work 


; Load local variable k 

; Write it in return value slot 
; Pop local variables 

; Pop the dynamic link 


; Pop the return address 





图 14-8 C 函 数 调用 和 返回 的 LC-3 代 码 (£x) 


在 此 ， 我 们 按照 LC-3 的 函数 调用 规则 ， 总 结 一 下 函数 调用 的 各 个 步骤 首先， 调用 者 将 各 参 
数 顺序 压 入 栈 ,然后 由 JSR 指 令 跳 转 人 被 调用 者 ， 被 调用 者 则 在 初始 化 阶段 ， 完 成 返回 值 空间 分 配 、 
保存 调用 者 相关 的 备份 信息 、 为 自己 的 局 部 变量 分 配 栈 空间 等 任务 :随后 ， 被 调用 函数 完成 任务 
执行 ， 任 务 完 成 后 ， 被 调用 者 要 将 返回 值 写 至 为 之 预 留 的 空间 ， 然 后 弹出 保存 的 调用 者 备份 信息 ， 
返回 调用 者 ， 最 后 ， 调 用 者 读 出 返回 值 ， 并 将 栈 空 间 中 的 返回 值 和 参数 弹出 ， 然 后 继续 执行 。 

或 许 你 会 想 ， 仅 仅 是 一 个 函数 调用 ， 有 必要 动用 这 么 多 的 代码 吗 ? 答案 是 ， 所 有 的 代码 都 是 
必须 的 ， 该 调用 规则 已 无 法 再 简化 了 。 在 调用 规则 的 设计 中 ， 存 在 这 样 一 个 要 求 : 任何 函数 都 可 
以 再 调用 其 他 函数 。 这 意味 着 ， 对 于 调用 者 ， 除 了 接 哲 信息 ( 即 被 调用 者 的 返回 值 类 型 、 参 数列 
表 ) 之 外 ， 它 不 需要 知道 更 多 有 关 被 调用 者 的 信息 。 同 样 , ， 被 调用 者 也 应 该 保持 与 调用 者 之 间 的 
无 关 性 。 正 因为 如 此 ，C 函 数 采 用 了 如 上 所 示 的 调用 规则 步骤 。 


14.4 问题 求解 

为 使 函数 为 我 们 所 用 ， 我 们 需要 将 它 应 用 于 我 们 的 编程 方法 学 中 。 在 本 节 中 ， 我 们 将 通过 两 
个 例子 介绍 函数 的 用 法 ， 这 两 个 例子 分 别 展示 了 函数 的 不 同 用 法 。 

在 自 上 而 下 的 算法 设计 中 ， 函 数 是 个 很 好 的 划分 点 。 在 问题 的 分 解 中 ， 各 个 “模块 ” 
(component) 表现 为 不 同 的 计算 任务 。 每 个 计算 任务 都 需要 一 个 对 应 算法 ， 所 以 各 个 “模块 ” 自 
然 地 对 应 为 各 个 函数 。 例 如 ， 第 一 个 例子 的 任务 是 ， 将 文本 的 小 写 转换 为 大 写 ， 该 例子 非常 直观 
地 体现 了 自 项 向 下 设计 中 的 “模块 函数 ”概念 。 

函数 的 另 一 个 作用 在 于 ， 封 装 代码 中 常用 的 基本 操作 。 我 们 可 以 将 函数 理解 为 是 对 编程 语言 
操作 符 集合 的 一 个 扩展 (针对 特定 问题 的 定制 )。 所 以 ， 第 二 个 例子 的 任务 就 是 “ 毕 达 哥 拉 斯 三 角 
形 判 断 ”， 我 们 创建 一 个 计算 x* 的 基本 函数 ， 以 辅助 整个 计算 。 


14.4.1 例 1， 大 小 写 转换 


本 程序 的 任务 是 ， 从 键盘 读 人 字符 串 ， 将 转换 结果 输出 在 屏幕 上 。 该 程序 与 第 13 章 中 图 13-8 
所 示 的 程序 非常 相似 (输入 然后 输出 ) ， 但 该 程序 有 个 修改 : 字符 在 输出 之 前 ， 先 做 小 写 到 大 写 的 
转换 。 

我 们 将 以 图 13-8 所 示 程 序 为 基础 ， 该 程序 使 用 一 个 while 循 环 ， 不 断 地 从 键盘 读 人 字符， 然后 
打印 输出 。 在 此 框架 基础 上 ， 添 加 一 段 小 写字 母 判 断代 码 (如 果 是 小 写 ， 则 将 它 转换 为 大 写 )。 我 
们 完全 可 以 直接 在 while 循 环 体内 添加 这 段 代 码 ， 但 考虑 到 模块 的 “ 自 包含 ”(self-contained) 特性 ， 
我 们 决定 将 它 包 装 为 一 个 函数 。 

转换 函数 在 键盘 读 人 后 、 屏 幕 输入 前 被 调用 。 它 的 输入 是 一 个 字符 参数 ， 返 回 值 同 样 也 是 字符 参 
数 (必定 是 大 写字 母 或 非 字母 字符 )。 图 14-9 所 示 是 该 程序 的 执行 流程 (fltowchart) 。 我 们 将 其 中 来 自 图 
13-8 的 流程 部 分 ， 用 阴影 部 分 表示 。 与 原 流程 相 比 ， 这 里 多 了 一 个 负责 转换 的 函数 模块 《conversion)。 
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图 14-9 字符 大 写 转换 的 任务 分 解 


图 14-10 所 示 是 最 终 的 完整 C 程 序 。 从 键盘 读 入 ， 然 后 将 输入 的 小 写字 母 转 换 为 大 写字 母 ， 最 
显示 输出 。 如 果 输 入 为 换行 符 ， 程 序 终止 。 小 写字 母 转换 为 大 写字 母 的 过 程 ， 是 由 函数 ToUpper 
完成 的 。 注 意 ， 函 数 体内 ASCII 字 符 的 使 用 ， 单 引号 代表 字符 (Gn A’) 的 ASCI 码 值 。 所 以 x 
达 式 “a” 一 “A 表示 字符 a 的 ASCII 码 值 减 去 字符 “A” 的 ASCII 码 值 。 
#include <stdio.h> 


/* Function declaration */ char ToUpper (char inchar); 


/* Function main: */ 
/* Prompt for a line of text, Read one character, */ 
/* convert to uppercase, print it out, then get another */ 
int main() 


{ 


char echo = 'A'; /* Initialize input character */ 
char upcase; /* Converted character */ 


while (echo !- 'WAn') ( 
scanf ("$c", &echo); 
upcase = ToUpper (echo); 
printf("$c", upcase); 


) 


/* Function ToUpper: 
/* If the parameter is lower case return 


/* its uppercase ASCII value 
char ToUpper(char inchar) 


图 14-10 带 有 将 小 写字 母 转 换 为 大 写字 母 的 函数 的 程序 
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char outchar; 


if ('a' <= inchar && inchar <= 'z') 
outchar = inchar - ('a' - 'A'); 


else 
outchar - inchar; 


return outchar; 





图 14-10 带 有 将 小 写字 母 转换 为 大 写字 母 的 函数 的 程序 (2) 


14.4.2 例 2， 毕 达 哥 拉 斯 三 角形 


下 面 我 们 尝试 通过 编程 方法 求解 这 样 一 个 问题 : 计算 所 有 边 长 小 于 某 个 特定 输入 值 的 毕 达 哥 
拉 斯 三 角形 。 所 谓 “ 毕 达 哥 拉 斯 三 角形 ”， 是 指 这 样 3 个 整数 值 4a、b、c， 它 们 之 间 满 足 关 系 “c? = 
qa? + b*”。 换 外话 说 ,，a、b、c 是 直角 三 角形 的 三 个 边 (ce 为 斜 边 )。 例 如 ， 整 数 3、4、5 就 构成 一 个 
毕 达 哥 拉 斯 三 角形 。 我 们 的 问题 是 ， 求 解 所 有 的 毕 达 哥 拉 斯 三 角形 (a，b，c)， 且 它们 的 值 都 小 
于 用 户 输入 的 最 大 值 。 

我 们 将 采用 “暴力 法 ”寻找 所 有 的 三 角 组 合 。 换 句 话 说， 如 果 用 户 给 定 最 大 值 max ， 我 们 就 检 
查 所 有 小 于 max 的 整数 组 合 ， 验 证 它们 是 否 符 合 毕 达 哥 拉 斯 三 角 关 系 。 假 设 三 个 数 (或 边 ) 为 
sideA 、sideB 和 sideC， 将 它们 遍历 1~max ( 即 循环 计数 )。 更 准确 地 说 ， 设 置 三 层 for 循 环 ， 一 个 记 
历 sideC， 一 个 遍历 sideB， 另 一 个 遍历 sideA， 依 次 崇 套 。 循 环 的 核心 ， 是 检查 三 个 值 是 否 符合 毕 
达 哥 拉 斯 三 角 关系 。 如 果 符 合 ， 则 将 这 三 个 数 的 组 合 打印 出 来 。 

毕 达 哥 拉 斯 三 角 关 系 的 验证 方法 是 ， 将 三 个 数 代 入 如 下 关系 表达 式 进行 判断 ， 

(sideC * sideC == (sideA * sideA + sideB * sideB)) 

其 中 ， 我 们 发 现 “ 求 平方 ”是 一 个 基本 操作 ( 即 代码 中 很 多 地 方 要 用 到 )， 所 以 我 们 将 该 运算 
封装 为 函数 Squared， 该 函数 的 返回 值 等 于 输入 参数 的 平方 。 因 而 ， 将 之 前 的 表达 式 重 新 表示 如 下 
(注意 ， 该 代码 更 清楚 地 表达 了 计算 意图 ) 


(Squared(sideC) == Squared(sideA) + Squared (sideB)) 
图 14-11 所 示 是 该 问题 对 应 的 C 程 序 。 事 实 上 ， 与 “暴力 法 ” 相 比 ， 还 存在 一 种 更 好 的 计算 方 
法 (你 能 否 修改 代码 使 其 更 快 ? ) 。 而 在 此 ， 我 们 着 重 讨论 的 是 函数 的 使 用 。 
#include <stdio.h> 
int Squared (int x); 
int main() 
int sideA; 
int sideB; 
int sideC; 


int maxC; 


printf("Enter the maximum length of hypotenuse: "); 
scanfí("&d", &maxC); 


for (sideC = 1; sideC <= maxC; sideC««) { 
for (sideB = 1; sideB «- maxC; sideB++) [ 
for (sideA = 1; sideA <= maxC; sideA««) { 
if (Squared(sideC) == Squared(sideA) + Squared (sideB)) 
printf("td $d $dWMn", sideA, sideB, sideC); 


) 





图 14-11 计算 毕 达 哥 拉 斯 三 角形 的 C 程 序 
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/* Calculate the square of a number */ 


int Squared(int x) 


return x * x; 





图 14-11 计算 毕 达 哥 拉 斯 三 角形 的 C 程 序 (k) 


14.5 小 结 


本 章 介 绍 了 C 语 言 中 的 函数 。 函 数 又 称 为 子 程序 , 在 很 早 之 前 就 成 为 编程 语言 必 备 的 一 个 概念 。 
函数 的 作用 ， 体 现 为 它 为 编程 任务 提供 了 一 种 创建 基本 操作 的 机 制 。 从 某 种 意义 上 说 ， 它 扩展 了 
编程 语言 的 操作 和 结构 。 

本 章 的 关键 概念 如 下 所 示 : 

。C 函 数 的 语法 。 在 C 语 言 中 使 用 函数 时 ， 必 须 先 声明 函数 (通常 在 代码 的 最 前 面 )， 包 括 函 数 

名 、 返 回 值 的 类 型 和 输入 参数 的 类 型 及 顺序 。 函 数 的 定义 部 分 是 函数 的 实际 代码 。 函 数 只 在 
被 调用 时 才 执 行 。 函 数 调用 包含 形式 参数 (传递 给 函数 的 数值 )。 

*C 函 数 的 底层 实现 。C 函 数 可 以 在 源 文件 的 任何 函数 内 被 调用 (其 至 是 在 目标 文件 中 )。 为 此 ， 
我 们 定义 了 一 种 “函数 调用 规则 ”， 以 解决 其 中 存在 的 一 些 问题 (如 函数 自身 的 调用 )。 这 
种 规则 的 定义 建立 在 运行 时 栈 的 基础 上 ， 包 括 : 调用 者 通过 压 栈 方式 传递 参数 ， 然 后 调用 函 
数 ， 参 数值 写 人 被 调用 者 活动 记录 ， 被 调用 者 完成 任务 ， 从 栈 中 弹出 活动 记录 ， 为 调用 者 留 
下 返回 值 等 。 

。 编程 中 的 函数 使 用 。 不 使 用 任何 尔 数 ， 也 可 以 完成 编程 。 但 这 会 造成 代码 难以 阅读 、 维 护 

和 扩展 等 问题 ， 且 更 容易 产生 错误 。 函 数 为 我 们 提供 了 一 种 抽象 机 制 : 我 们 可 以 为 某 个 特定 

任务 编写 一 个 函数 ， 并 对 它 进 行 单独 调试 和 测试 。 


14.6 习题 


14.1 ”试问 main 函 数 的 重要 性 是 什么 ? 为 什么 每 个 程序 必须 有 这 个 函数 ? 
14.2 根据 活动 记录 的 结构 ， 回 答 下 列 问 题 。 
a. 动态 链 的 作用 是 什么 ? b. 返回 地 址 的 作用 是 什么 ? 
c. 返回 值 的 作用 是 什么 ? 
14.3 ”根据 C 函 数 的 语法 ， 回 答 下 列 问题 。 
a. 什么 是 函数 声明 ? 它 的 作用 是 什么 ? b. 什么 是 函数 原型 ? 
c. 什么 是 函数 定义 ? d. 什么 是 形式 参数 (argument) ? 
e. 什么 是 参数 (parameter) ? 
14.4 试 指出 ， 如 下 操作 ， 分 别 是 由 调用 者 还 是 被 调用 者 来 完成 的 ? 
a. 将 参数 值 写 人 活动 记录 ， b. 填写 返回 值 ， 
c. 填写 动态 链 (dynamic link) ， 
d. 修改 R5 的 内 容 (指向 被 调用 者 的 活动 记录 )。 
14.5 试 给 出 如 下 程序 的 输出 结果 ， 并 解释 。 
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void MyFunc(int z}; 
int main() 

int Z = 2; 

MyFunc (z); 


MyFunc (z) ; 


} 
void MyFunc(int z) 
printf("$d ", z); 


Zt; 


} 
14.6 试问 如 下 程序 的 输出 结果 是 什么 ? 


#include «stdio.h» 
int Multiply(int d, int b); 
int d = 3; 


int main() 


von 


c = Multiply(a, b): 
printf ("%d 3d $d td Sd\n", a, b, c, d, e); 


int Multiply(int d, int b) 


n 


"onu ct 


a; 
2; 
3 


这 mue 


return (a * b); 


14.7. ”阅读 如 下 Bump 范 数 的 C 代 码 ， 并 回答 问题 。 


int Bump (int x) 


int a; 


return a; 


) 

a. 画 出 Bump 的 活动 记录 ， 

标注 如 下 描述 与 活动 记录 的 什么 字段 (entry) 相 匹配 ， 并 解释 它们 的 含义 ， 

(1) 局 部 变量 ， 

(2) 形式 参数 (或 输入 参数 ) ， 

(3) 某 个 指令 的 地 址 ， 

(4) 某 个 数据 的 地 址 ; 

(5) 其 他 。 
c. 在 Bump 的 医 动 记录 中 ， 有 些 字段 是 由 Bump 的 调用 者 填写 的 ， 有 些 则 由 Bump 自 己 填 写 。 
请 指出 Bump 自 己 填写 的 那些 字段 。 

14.8 ”试问 如 下 代码 的 输出 结果 是 什么 ? 阐述 其 中 Swap 函 数 的 含义 。 
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int main() 
int x = 1; 
int y = 2; 


Swap(x, yl; 
printf ("x = $d y = d\n", x, y); 


void Swap(int y, int x) 


14.9 


int temp 


传递 给 函数 的 参数 ， 是 在 跳 转 至 该 函数 的 JSR 指 令 之 前 还 是 之 后 压 人 栈 中 的 ?请 解释 其 中 的 
道理 。 


14.10 “C 语 言 函 数 food 的 LC-3 编 译 代码 (部 分 ) 如 下 所 示 ， 试 回答 问题 : 


14.11 


14.12 


14.13 


14.14 


food: 
ADD R6, R6, & 
STR R7, R6, & 
ADD R6, R6, 48-1 
STR R5, R6, & 
ADD R5, R6, & 
ADD R6, R6, # 


a. 该 函数 中 有 多 少 个 局 部 变量 ? 
b. 该 函数 有 两 个 整 型 参数 x- 和 y。 试 写 出 表达 式 x + y 的 运算 代码 。 
阅读 如 下 代码 ， 回 答 问 题 : 


int main() 


a = Inití(a); 
b = Unit(b); 


printf("à = $d b = $dMn", a, b); 


} 
int Init(int x) 
int y = 2; 


return y * X; 


int Unit(int x) 
int z; 


return z * X; 


) 

a. 该 程序 的 输出 是 什么 ? 

b. 函数 Uint 开 始 执行 时 ， 局 部 变量 z 的 值 取决 于 什么 ? 

试 修改 如 图 14-10 所 示 的 代码 ， 使 其 具备 将 输入 字符 转换 为 小 写字 母 的 能 力 。 换 名 话 说 ， 就 
是 要 求 程序 同时 输出 输入 的 小 写 和 大 写 形式 。 

试 编写 国 数 ， 打 印 整数 的 4 进 制 值 〈 即 只 使 用 数字 0、1、2、3)。 并 基于 该 函数 ， 编 写 程序 ， 
从 键盘 读 人 两 个 整数 ， 然 后 将 两 个 数 及 其 相 加 结果 以 4 进 制 方式 显 式 在 屏幕 上 。 

试 编写 函数 ， 如 果 它 的 第 一 个 输入 参数 恰好 被 第 二 个 参数 整除 ， 则 返回 1。 然 后 ， 基 于 该 函 
数 ， 编 写 程序 ， 找 出 能 够 被 所 有 小 于 10 的 数 整除 的 最 小 数 。 
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14.15 


14.16 


14.17 


14.18 


14.19 


E14 * 


如 下 C 程 序 ， 被 编译 成 LC-3 机 器 语言 ， 且 执行 前 的 加 载 地 址 为 x3000。 如 果 不 算 跳 转 至 IO 
库 函 数 的 JSR 指 令 在 内 ， 该 目标 代码 中 包含 3 条 JSR 指 令 〈 分 别 跳 人 函数 f、g 和 h) 。 假 设 ，3 
条 JSR 指 令 的 地 址 分 别 是 x3102、x3301 和 x3304。 再 假设 用 户 输 入 为 “4、5、6”。 试 画 出 当 
程序 从 函数 返回 时 ， 运 行 时 栈 的 快照 (假设 栈 的 基地 址 是 xEFFF)。 
#include <stdio.h> 
int f(int x, int y, int z); 
int glint arg); 
int h(int argl, int àarg2); 
int main() 

int a, b, C; 

printf ("Type three numbers: "); 

scanf("td $d d", ka, &b, &c); 


printfí("*à", fla, b, c)»; 
) 


int f(int x, int y, int z) 
int x1; 
xl = g(x); 
return h(y, Z) * X1; 
int glint arg) 
{ 


return arg * arg; 


int h(int argl, int arg2) 


return argi / arg2; 


再 次 引用 前 面 章节 介绍 的 “机 器 忙 ”例子 ， 我 们 以 位 模式 表示 16 台 机 器 的 忙碌 状态 ， 即 某 

个 bit 为 0 则 代表 该 机 器 “ 忙 ”"， 为 1 则 代表 该 机 器 “空闲 ”。 

a. 试 编写 函数 ， 根 据 输入 的 状态 位 模式 ， 统 计 “ 忙 ”状态 机 器 的 数量 。 即 函数 的 输入 是 状 
态 位 模式 ( 整 型 变量 )， 输 出 是 忙碌 机 器 的 数量 ， 

b. 试 编写 函数 ， 根 据 两 个 已 知 状态 位 模式 ， 判 断 状态 发 生变 化 的 机 器 (如 从 人 忙 变 为 空闲 ， 
或 从 空闲 变 为 忙 ) 。 函 数 输出 同样 是 一 个 简单 位 模式 ， 相 应 位 为 1 代表 该 机 器 状态 发 生 
变化 ， 

c. 试 编写 程序 ， 从 键盘 连续 读 人 10 个 状态 位 模式 ， 计 算 平 均 的 忙碌 机 器 数量 以 及 状态 发 生 
变化 的 机 器 数量 。 用 户 和 输入 全 1 的 位 模式 (所 有 的 机 器 均 为 空间 )， 则 代表 输入 结束 。 

a. 试 编写 一 个 仿真 “4 选 1 开 关 ”(4-to-1 multiplexor) 的 C 函 数 。 参 考 如 图 3-13 所 示 的 4 选 1 

开关 描述 ， 

b. 试 编写 一 个 仿真 LC-3 ALU 行 为 的 C 函 数 。 

在 电话 机 上 ， 标 着 2，3，4，…，9 的 按键 都 有 对 应 的 字母 。 例 如 ， 按 键 2 所 对 应 的 字母 是 4、 

8 和 C。 试 编写 程序 ， 将 一 个 7 位 电话 号 码 的 所 有 对 应 字母 序列 表示 出 来 。 提 示 ， 编写 一 个 

映射 数字 和 字母 的 函数 。 注 意 : 数字 1 和 0 没有 任何 对 应 字母 。 

如 下 C 程 序 中 ， 同 时 使 用 了 全 局 变量 和 局 部 变量 。 试 问 ， 它 的 输出 结果 是 什么 ? 

Se garaio.» /* Global variable */ 

int subl(int fluff); 

int main () 


int t = 2; 
int z; 


int 


Z-t; 
Z-2251; 
printf("A: The variable z equals $dWAn", z); 


{ - 


z= t; 
t = 3; 
{ 
int t - 4j 
zzt; 
Z=Z+ l; 
printf("B: The variable z equals %d\n", z); 
} 
z = subi(z); 
Z-241; 
printf("C: The variable z equals *dWMn", z); 
} 
z= t; 


Z= Z+ l; 
printf ("D: The variable z equals $d\n", z); 


subl (int fluff) 


int i;- 
i = t; 
return (fluff + i); 
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第 15 章 ”测试 与 调试 技术 


15.1 概述 


1999 年 12 月 ， 美 国航 空 航天 局 (NASA) 控制 中 心 和 “火星 极地 登陆 者 ”(Mars Polar Lander) 
探测 器 的 通信 突然 中 断 ， 此 时 探测 器 即将 接近 火星 表面 ， 但 却 从 此 永远 失去 了 联系 。 火 星 极地 登 
陆 者 的 任务 是 探测 火星 南极 区 域 的 土壤 和 水 分 。NASA 声 称 探测 器 极 有 可 能 是 在 着 陆 过 程 中 与 火星 
表面 发 生 碰 擅 ， 而 调查 者 在 仔细 分 析 了 当时 的 情况 之 后 ， 认 为 原因 是 控制 软件 出 现 了 不 可 恢复 的 
致命 性 错误 ， 导 致 探测 器 在 距离 火星 表面 还 有 40 米 高 空 ( 而 不 是 已 着 陆 ) 时 关闭 引擎 ， 从 而 造成 
无 法 挽回 的 错误 。 将 探测 器 发 射 人 太空 的 物理 复杂 性 是 惊人 的 ， 而 控制 软件 的 复杂 性 也 同样 如 此 。 
软件 和 机 械 、 电 气 等 子 系统 有 机 地 组 成 了 整个 系统 ， 但 软件 的 正确 性 更 难于 把 握 ， 因 为 软件 是 
“不 可 见 的 ”。 它 不 像 其 他 系统 ， 如 推进 系统 、 登 陆 系 统 那 样 易于 观察 。 

今天 ， 软 件 已 无 处 不 在 。 你 的 手机 、 汽 车 中 ， 黄 至 本 书 的 排版 处 理 ， 都 是 由 千 万 行 的 软件 代 
码 所 控制 的 。 由 于 软件 在 现今 世界 中 扮演 着 重要 角色 ， 我 们 必须 保证 软件 按照 我 们 所 期 望 的 那样 
正常 运行 。 程 序 的 设计 过 程 不 是 自动 进行 的 ， 在 编写 过 程 中 难免 引入 错误 。 换 句 话说， 程序 在 编 
写 出 来 之 后 ， 并 不 意味 着 它 就 能 正确 运行 。 我 们 必须 在 尽 可 能 地 测试 和 调试 了 所 有 的 可 能 性 之 后 ， 
才能 “假设 ” 它 是 完整 的 。 

程序 员 通常 花费 更 多 的 时 间 来 调试 程序 ， 而 不 是 编写 程序 。 专 家 的 调查 表明 ， 对 一 个 有 经 验 
的 程序 员 而 言 ， 调 试 代 码 所 花 的 时 间 远 远 超过 他 /她 编写 代码 的 时 间 。 代 码 的 编写 和 测试 /调试 之 间 
有 不 可 分 割 的 关系 ， 我 们 将 在 本 章 对 代码 测试 和 调试 中 的 一 些 基 本 概念 进行 介绍 。 

测试 的 目的 是 “暴露 ”问题 (bug9)， 而 调试 的 目的 是 “解决 ”问题 。 测 试 代码 的 基本 方法 ， 
通常 是 向 程序 (或 局 部 代码 ) 注入 尽 可 能 多 的 、 各 种 各 样 的 输入 条 件 ， 以 迫使 软件 暴露 bug。 以 
ToUpper 函 数 的 测试 为 例 (参考 前 一 章 ， 该 函数 将 输入 的 字母 改 为 大 写 并 返回 ) 。 我 们 将 传人 所 有 
可 能 的 ASCII 码 ， 然 后 观察 函数 的 输出 结果 看 看 函数 是 否 按 规范 工作 。 如 果 针 对 特定 输入 ， 它 产生 
了 错误 输出 ， 那 么 我 们 就 发 现 了 一 个 bug。 我 们 应 该 尽 可 能 地 在 开发 阶段 就 发 现 bug ， 而 不 要 让 党 
无 准备 的 用 户 在 意外 情况 下 遇 到 错误 。 仍 然 以 “火星 极地 登陆 者 ”为 例 ，NASA 的 工程 师 们 应 该 让 
它 在 地 球 表面 时 就 出 现 错误 ， 而 不 是 等 到 在 火星 表面 40 米 高 度 处 才 出 现 错误 。 

基于 对 程序 的 阅读 和 对 其 执行 情况 的 观察 ， 程 序 员 通常 可 以 确定 一 些 问题 的 所 在 。 程 序 调试 
如 同 玩 拼 图 游戏 ， 又 如 同 犯罪 侦察 ， 程 序 员 必须 检查 所 有 可 能 的 线索 ， 才 能 找 出 问题 的 根源 。 调 
试 的 第 一 任务 是 收集 bug 信 息 ， 学 会 怎样 “系统 地 ”收集 bug 信 息 会 对 调试 大 有 帮助 (如 代码 中 关 
键 变量 的 执行 结果 )。 

本 章 将 介绍 几 种 在 程序 中 查找 和 修订 bug 的 技术 。 首 先 ， 我 们 介绍 编程 中 一 些 常 见 错误 的 分 
类 ， 然 后 介绍 快速 发 现 这 些 错误 的 测试 方法 ， 最后， 是 隔离 和 修补 这 些 错 误 的 调试 技术 。 同 时 ， 
我 们 还 将 介绍 一 些 “ 预 防 ” 技 术 ， 以 尽量 减 小 代码 出 错 的 可 能 性 。 

日 ”bug 原意 是 “臭虫 ”( 如 暗 螂 等 )， 程 序 员 将 程序 代码 中 存在 的 问题 称 为 bug， 称 找到 错误 的 过 程 为 “debug” 


ESL), 。 因 为 这 是 个 非常 直观 且 通 俗 的 称 法 ， 且 已 成 为 既成 事实 的 “专业 名 词 ”， 所 以 本 书 对 bug、 
debug 等 不 再 做 翻译 。 一 一 译 者 注 
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15.2 错误 类 型 


如 果 你 了 解 错误 的 各 种 可 能 类 型 ， 无 疑 可 更 好 地 发 现 和 修改 错误 。 下 面 ， 我 们 将 遇 到 的 代码 
错误 分 为 三 类 : (0) 语法 错误 (Syntactic error) 最 容易 处 理 ， 因 为 编译 器 就 能 捕 扣 它们。 编译 器 
在 将 源 代码 翻译 至 机 器 代码 时 ， 会 提示 并 准确 地 指出 哪 一 行 出 错 了 ; (2) 语义 错误 (Semantic 
eror), ， 则 很 难 被 修改 。 语 义 错误 出 现 的 情况 是 语法 上 完全 正确 ， 但 执行 结果 却 与 我 们 期 望 的 不 同 。 
语法 和 语义 错误 都 属于 “印刷 ”错误 ， 即 我 们 在 硕 键 盘 的 时 候 出 现 失 误 ， (3) 算法 错误 
(Algorithmic error) 是 指 我 们 解决 问题 的 时 候 所 采用 的 方法 出 错 了 ， 通 常 这 类 问题 很 难 检测 ， 且 即 
使 检测 到 了 也 很 难 修改 。 

#include <stdio.h> 


int mainí) 


int i 
int j; 


for (i = 0; i <= 10; i++) { 
j= i * 7; 
printf ("$d x 7 = $dWn", i, j); 





图 1$-1 这 个 程序 中 存在 一 个 语法 错误 


15.2.1 语法 错误 


在 C 语 言 中 ， 语 法 错误 (又 称 为 syntax error 或 parse error) 都 会 被 编译 器 捕获 。 当 编码 没有 严 
格 遵循 C 语 言 规范 上 时， 代码 在 编译 之 时 这 些 “ 不 规范 ”之 处 就 会 被 编译 器 指出 。 图 15-1 的 代码 中 存 
在 一 个 syntax 错 误 ， 该 错误 在 编译 之 时 将 被 标识 出 来 。 

变量 ;的 声明 语句 少 了 分 号 。 作 为 一 个 初级 C 程 序 员 ， 类 似 声 明 语 名 缺少 分 号 变量 未 声明 这 样 
的 错误 会 经 常 发生 。 幸 运 的 是 ， 这 类 错误 很 容易 发 现 ， 因 为 编译 器 会 检测 到 并 明确 指出 ， 所 以 很 
容易 修改 。 真 正 的 问题 是 语法 错误 修改 之 后 ， 更 难 的 语义 和 算法 问题 却 留 下 了 。 


15.2.2 语义 错误 

MEX (Semantic) 错误 和 语法 错误 很 类 似 。 错 误 的 原因 相同 ， 即 我 们 在 编写 程序 的 时 候 ， 很 难 
保证 头脑 和 手指 完全 一 致 。 语 义 错 误 并 不 意味 着 一 定 包含 了 语法 错误 ， 即 这 些 程序 能 顺利 地 通过 
编译 〈 即 语法 是 正确 的 ) 且 能 正常 执行 。 但 输出 的 结果 分 析 表 明 ， 执 行 结果 与 我 们 期 望 的 不 一 样 。 
图 15-2 和 图 15-1 的 代码 “几乎 ”完全 一 样 ， 但 存在 一 个 很 小 的 语义 错误 (而 不 是 语法 错误 ) ， 程 序 
的 输出 应 该 是 数字 7 的 乘法 表 。 


#include «stdio.h» 
int main() 


int i; 


int j; 


for (i = 0; i <= 10; i++) 
j=i*7; 
printf("%d x 7 = %d\n", i, j); 





图 15-2 这 段 代 码 中 存在 一 个 语义 错误 
但 是 ， 程 序 执行 一 遍 就 暴露 问题 了 ， 结 果 只 输出 了 一 行 (而 不 是 一 张 表 ) 值 。 赁 着 掌握 的 C 请 
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言 知 识 想 想 就 知道 是 为 什么 错 。 为 什么 输出 是 “11 x 7 = 70" ? 该 程序 所 犯 的 错 被 称 为 “控制 流 
(control flow) 错误 ”， 这 个 问题 是 程序 的 控制 流 即 执行 顺序 与 设想 的 不 一 致 

再 如 ， 图 15-3 存 在 一 个 常见 的 但 非常 诡异 的 语义 问题 ， 与 局 部 变量 相关 。 例 子 与 14.2 节 讨论 的 
求 阶乘 程序 类 似 。 

该 程序 的 目的 是 ， 从 键盘 读 取 一 个 值 ， 然 后 计算 所 有 小 于 等 于 该 ”的 整数 之 和 (如 : 计算 1 + 
2+3+… +1)。 但 试 着 执行 一 下 该 程序 ， 会 发 现 执行 结果 完全 出 平 所 料 ， 为 什么 它 工作 不 对 呢 ? 
(提示 : 请 画 出 该 程序 执行 过 程 中 栈 空间 的 运行 变化 ) 

#include «stdio.h» 
int AllSum(int n); 
int main() 


int in; /* Input value 
int sum; /* Value of 1+2+3+..+n 
printf ("Input a number: "); 

Scanfí"t&d", &in); 


sum = AllSum(in); 
printf("The AliSum of $&d is &dWMn", in, sum); 


int AllSum(int n) 


/* Result to be returned 
/* Iteration count 


int result; 

int i; 

for (i = 1; i <= n; i++) /* This calculates sum 
result = result + i; 


return result; /* Return to caller 


} 





图 15-3 程序 中 存在 一 个 涉及 局 部 变量 的 bug 


语义 错误 特别 麻烦 ， 因 为 ， 它 既 不 能 被 编译 器 检测 出 来 ， 也 很 难为 程序 员 所 察觉 。 只 有 特定 输 
入 的 触发 才 会 暴露 出 错误 。 修 改 完 前 面 的 语义 错误 之 后 ， 再 看 图 15-3 代 码 中 的 AllSum 代 码 段 且 传递 
小 于 等 于 0 的 值 或 是 很 大 的 值 给 AllSum， 此 时 AilSum 返 回 一 个 错误 结果 。 因 为 ， 这 些 数值 都 超出 了 
整 型 变量 result 所 能 表达 的 范围 。 改 正 这 个 错 吧 ， 但 输入 一 个 小 于 1 的 数 ， 又 将 会 发 现 另 一 个 bug。 

有 些 错误 是 在 程序 运行 时 ， 由 于 非法 操作 而 被 系统 捕捉 到 。 几 乎 所 有 的 计算 机 系统 都 有 安全 
机 制 (safeguard) 来 防止 错误 扩展 ， 以 至 于 影响 其 他 程序 的 运行 。 例 如 ， 我 们 不 希望 用 户 程序 能 
够 修改 存储 操作 系统 的 内 存 空间 或 直接 修改 那些 会 影响 其 他 程序 的 寄存 器 (因为 这 些 寄存 器 会 导 
致 整个 系统 shutdown) 。 当 程序 存在 这 样 的 非法 操作 时 ， 操 作 系 统 将 强制 终止 该 程序 ， 并 在 屏幕 上 
打印 运行 时 出 错 (run-time error) 信息 。 例 如 ， 将 AlSum 中 的 scanf 语 句 改 为 : 

Sscanf("$d", in); 

注意 ， 本 例 中 “人 ”符号 的 作用 如 第 16 章 所 述 ， 是 C 语 言 中 的 一 个 特殊 操作 符 。 如 果 使 用 scanf 
的 时 候 漏 了 这 个 “&” 符 号 ， 就 可 能 引发 运行 错 。 因 为 ， 它 将 引发 程序 去 修改 它 无 权 访问 的 内 存 空 
间 。 在 后 面 的 章节 中 ， 我 们 会 更 详细 地 分 析 该 错误 的 具体 原因 。 


15.2.3 算法 错误 
算法 错误 (Algorithmic) 源 于 程序 设计 错 。 即 程序 本 身 的 运行 完全 符合 设计 要 求 ， 但 设计 本 
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错误 被 发 现 和 独立 ， 却 很 难 修改 。 值 得 庆幸 的 是 ， 在 设计 阶段 能 合理 规划 ， 即 写 代 码 前 恰当 计划 ， 
这 类 错误 是 可 以 被 减少 甚至 被 请 除 的 。 

图 15-4 的 代码 中 存在 一 个 简单 的 算法 错误 ， 程 序 任务 是 输入 “年 份 ”， 然 后 判断 是 否 是 半年 
(leap year), 

第 一 眼看 去 ， 访 代码 似乎 完全 正确 。 每 四 年 出 现 一 次 图 年 ! 但 事实 上 不 是 这 样 的 ， 每 隔 一 个 
世纪 (100 年 ) 就 会 跳 过 一 个 半年 ， 而 每 四 百年 却 不 会 如 此 (如 :， 2000 年 是 一 个 疼 年 ， 但 2100 年 、 
2200 年 、2300 年 却 不 是 闵 年 )。 这 段 代 码 在 很 长 一 段 时 间 里 都 表现 正常 ， 但 特定 情况 下 却 出 错 。 我 
们 将 这 类 错 归 为 “算法 错误 ”或 设计 错 。 

另 一 个 算法 错误 的 例子 是 “大 名 昂 电 ”的 2000 年 问题 (Y2K bug)。 很 多 计算 机 程序 会 使 用 尽 
可 能 小 的 内 存 空间 来 保存 日 期 值 ， 它 们 在 表达 年 份 的 时 候 只 记录 年 份 的 最 低 两 个 数字 ， 导 致 2000 
年 和 1900 年 (或 1800 年 、 或 2100 年 等 ) 事实 上 难于 区 分 。 于 是 ， 在 跨越 1999 年 12 月 31 日 的 这 个 时 
刻 就 存在 Y2K 问 题 。 例 如 ， 你 在 1999 年 底 从 学 校 图 书馆 借 了 一 本 书 ， 还 书 期 限 是 2000 年 初 。 如 果 
学 校 图 书馆 的 计算 机 系统 存在 Y2K 问 题 ， 则 在 还 书 一 刻 你 将 接受 重 罚 。 为 此 ， 在 2000 年 1 月 1 日 前 ， 
全 世界 花费 了 大 量 的 资金 和 人 力 来 解决 Y2K 问 题 。 


15.3 测试 


在 资深 程序 员 中 流传 着 这 么 一 名 话 :“ 任 何 没有 测试 过 的 代码 都 存在 着 bug”"。 这 意味 着 好 的 测 
试 方法 对 软件 开发 是 至 关 重 要 的 。 什 么 是 测试 ? 即 我 们 让 软件 在 各 种 可 能 的 输入 模式 (模拟 真实 
使 用 环境 ) 下 运行 ， 然 后 分 别 检查 输出 是 否 正确 。 事 实 上 ， 一 个 软件 在 发 布 之 前 可 能 要 经 历 几 百 
万 次 的 试 运行 。 

在 理想 世界 中 ， 程 序 测试 方法 就 是 检测 程序 在 所 有 可 能 输入 下 的 执行 情况 ， 但 这 几乎 是 不 现 
实 的。 例如 ， 一 个 程序 是 用 来 找 出 处 于 整数 4 和 B 之 间 的 所 有 素数 ， 如 果 输 入 参数 4 和 8B 都 是 32 位 的 
数值 ， 则 共有 (2 种 输入 组 合 。 假 设 每 秒 运 行 100 万 个 用 例 (trial) ， 仍 然 需要 50 万 年 才能 完成 所 有 
测试 。 显 然 ， 测 试 所 有 的 输入 组 合 不 是 一 个 可 行 的 办 法 。 那 么 ， 哪 些 输 入 组 合 是 需要 测试 的 、 哪 
些 又 是 不 必要 的 昵 ? 如 果 我 们 随机 选取 输入 ， 运 气 要 非常 好 才能 查 出 程序 的 pug。 通 常 ， 软 件 工程 
师 采 用 一 些 系统 的 方法 来 测试 代码 。 典 型 的 有 ， 黑 盒 测 试 法 (black-box) 用 来 测试 程序 功能 是 否 
满足 设计 规格 说 明 (specification) ， 白 全 测试 法 (white-box) 则 用 来 有 目的 地 测试 程序 实现 的 各 
个 方面 ， 并 保证 每 行 代码 都 接受 了 测试 。 


15.3.1 RAA 


ZA (black-Box) 测试 关注 的 是 程序 的 输入 和 规格 说 明 上 的 输出 是 否 匹 配 ， 不 关心 其 内 部 的 
具体 实现 。 换 句 话说 ， 黑 盒 测 试 关 心 “ 程 序 能 做 什么 ”(what) ， 而 不 关心 “ 它 是 怎么 做 的 ”(how ) 。 
如 图 15-3 所 示 ， 程 序 AllSum 的 黑 盒 测试 过 程 包括 : 运行 程序 ， 输 入 数据 ， 将 程序 输出 与 手工 计算 
结果 相 比较 。 如 果 两 全 结果 不 匹配 ， 则 意味 着 要 么 是 程序 有 错 ， 要 么 是 手 算 能 力 有 问题 。 如 此 进 
行 下 去 ， 不 停 地 测试 ， 直 到 确信 它 的 功能 是 “可 信 ” 的 

然而 ， 对 于 较 大 的 程序 ， 该 测试 过 程 应 该 是 “自动 化 ”(automated) 的 ， 这 样 才能 保证 在 有 限 
时 间 内 能 完成 足够 的 测试 。 这 意味 着 还 需要 设计 一 个 “ 副 试 ”程序 ， 该 程序 能 自动 地 运行 被 测试 
程序 ， 并 为 其 提供 随机 输入 ， 同 时 匹配 输出 结果 ， 并 重复 这 项 工作 。 这 种 自动 化 方式 要 比 手工 测 
试 的 效率 高 得 多 。 

但 为 了 完成 黑 盒 测试 的 自动 化 ， 我 们 需要 一 种 方法 来 自动 地 检查 程序 的 输出 是 否 正 确 。 换 句 
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话说 ， 我 们 需要 开发 一 个 “检查 程序 器 ”(checker) ， 它 与 原 程序 不 同 ， 但 却 能 完成 相同 的 计算 任 
务 。 当 然 ， 如 果 检 查 程 序 和 被 测 程序 存在 相同 的 bug ， 则 黑 盒 法 检测 必然 失败 。 也 正 是 因为 这 个 原 
因 ， 编 写 检 测 器 程序 的 人 是 不 允许 看 黑 盒 里 的 代码 ， 以 保证 检测 器 和 被 测 程序 之 间 的 独立 性 。 


153.2 KAWE 


然而 ， 对 于 一 个 大 程序 ， 黑 盒 测 试 是 不 够 的 。 因 为 在 黑 盒 测试 中 ， 无 法 知道 哪些 代码 被 测试 
过 了 ， 哪 些 还 未 测试 。 按 照 前 面 的 格言 所 指出 的 “所 有 未 测试 过 的 代码 都 可 能 存在 bug”。 尤 其 是 
有 时 候 在 程序 的 输入 及 其 输出 说 明 不 太 具 体 的 情况 下 ， 黑 盒 测 试 变 得 异常 困难 执行 。 例 如 ， 黑 盒 
测试 一 个 声音 播放 器 (如 MP3 播 放 器 ) 就 很 难 ， 因 为 其 输出 质量 的 好 坏 很 难 明确 定义 。 另 外 ， 黑 
盒 测试 的 前 提 是 整个 软件 已 经 开发 完成 了 ， 这 意味 着 接受 测试 之 前 ， 该 程序 不 仅 能 通过 编译 ， 并 
且 必 须 已 有 一 些 规格 说 明 。 

所 以 ， 软 件 工程 师 们 在 使 用 墨盒 测试 的 同时 还 辅 之 以 白 盒 (White-Box) MED. AAM 
的 做 落 是 ， 将 软件 内 部 的 各 种 组 件 相互 独立 ， 然 后 分 别 铀 试 各 组 件 是 否 达到 设计 要 求 。 例 如 , 根 
据 白 盒 测试 来 测试 每 个 函数 是 否 正确 执行 ， 此 了 时， 程序 是 实现 来 划分 组 件 ， 而 不 是 按 它 的 规格 说 
明 划 分 ， 我 们 还 可 以 对 函数 中 的 每 个 循环 或 其 他 组 成 部 分 使 用 同样 的 测试 方法 。 

怎样 构建 白 盒 副 试 呢 ? 大 多 数 测 试 中 ， 我 们 可 能 需要 修改 原 人 代码。 例如， 为 了 测试 一 个 函数 
是 否 正 确 ， 我 们 需要 添加 一 些 代 码 ， 该 代码 将 增加 分 量 运行 时 间 但 能 重复 调用 该 函数 ， 且 每 次 调 
用 时 变换 不 同 的 输入 和 检查 相应 输出 。 我 们 可 能 在 代码 中 添加 大 量 的 printf 语 句 ， 将 内 部 变量 打印 
出 来 以 观察 它 的 值 检查 执行 是 否 正确 。 当 代码 完成 或 即将 发 布 的 时 候 ， 再 将 这 些 printf 语 句 删除 。 

常用 的 白 盒 测试 技术 是 在 程序 中 有 策略 地 安放 一 些 检 错 代码 。 这 些 代 码 将 检测 能 标 来 程序 是 
否 正确 运行 的 条 件 。 当 不 正常 状态 被 捕 提 后 ， 检 测 代 码 将 打印 出 一 条 警告 信息 ， 并 显示 当前 状态 
相关 信息 ， 或 将 程序 永久 性 终止 。 由 于 这 些 检 而 代码 将 断定 程序 执行 的 〈assert) 特定 条 件 ， 因 而 
我 们 又 称 这 些 检测 为 断言 器 “assertion "。 

例如 ，assertion 可 以 用 来 验证 代码 返回 值 是 否 落 在 规定 范围 内 ， 如 果 超 出 范围 ， 则 打印 错误 信 
息 。 以 下 面 的 IncomeTax 函数 为 例 ， 该 函数 的 功能 是 计算 “所 得 税 ”(Income Tax) 是 否 在 规定 额 
度 ， 从 这 一 代码 段 中 可 以 推论 税额 是 否 正确 ， 该 函数 是 按 提 供给 它 的 特定 收入 值 参 数 来 计算 所 得 
税 。 我 们 不 该 付 大 于 收入 (很 幸运 ) 的 所 得 税 ， 但 也 不 可 能 付 负 数值 的 税 ， 这 里 假设 IncomeTax 错 
断言 代码 将 给 出 警告 信息 。 

tax = IncomeTax(income); 


if (tax < 0 || tax > income) 
printf("Error in function IncomeTax!VWn"); 


一 个 完整 的 测试 中 ， 黑 合法 和 白 盒 法 都 是 必需 的 。 注 意 的 是 ， 白 盒 法 测试 本 身 是 无 法 测试 软 
件 的 全 部 功能 。 换 句 话 说， 即使 白 盒 法 测试 结果 全 通过 ， 但 仍 将 存在 部 分 规格 说 明 内 容 没 测试 。 
同样 ， 仅 用 黑 盒 法 也 无 法 保证 每 行 代码 都 被 测试 了 。 
15.4 调试 

发 现 错误 (bug) 之 后 的 任务 就 是 修正 它 ， 但 修正 错误 通常 比 发 现 它 更 困难 。 调 试 一 个 错 需 要 
全 面 运用 我 们 的 能 力 :观察 错误 现象 ， 如 错误 输出 ， 还 需要 更 多 其 他 的 信息 ， 如 引发 错误 所 在 的 
代码 行 。 然 后 ， 基 于 这 些 有 限 的 信息 ， 推 测 出 错误 的 根源 。 所 以 、， 有 效 地 进行 调试 的 关键 是 收集 
相关 标识 错误 的 信息 。 这 一 点 和 其 他 行业 一 样 ， 如 侦察 犯罪 现场 收集 的 证 据 ， 或 医生 在 治疗 前 要 
充分 检查 病人 的 病情 以 便 确诊 。 
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调试 中 要 采用 很 多 方法 收集 信息 ， 以 便 诊 断 出 错误 。 可 用 方法 有 简单 而 快捷 的 特定 方法 ， 也 
有 基于 调试 工具 的 系统 化 技术 。 


15.4.1 特定 方法 


最 简单 的 办 法 是 : 当 你 意识 到 程序 中 存在 错误 的 时 候 ， 仔 细 检 查 源 代 码 。 有 时 候 根据 错误 的 
特征 ， 能 很 快 落实 到 可 能 存在 错误 的 代码 。 这 种 方法 很 适合 于 代码 长 度 较 小 且 你 很 熟悉 的 代码 。 

另 一 种 简单 技术 则 是 在 代码 中 插入 打印 语句 。 例 如 ， 你 可 以 用 printf 打 印 出 认为 比较 重要 的 那 
些 变量 的 值 ， 以 帮助 发 现 bug。 你 可 以 在 代码 不 同 的 地 方 加 入 printf 语 句 ， 查 看 程序 的 控制 流 是 否 工 
作 正 常 。 例 如 ， 若 要 快速 判断 一 个 记 数 变量 控制 的 循环 的 循环 次 数 是 否 正确 ， 那 么 可 以 在 循环 体 
内 放置 一 条 printf 语 句 。 对 于 一 个 简单 程序 ， 类 似 的 特定 技术 很 容易 使 用 也 很 方便 ， 而 对 于 大 程序 ， 
错误 的 数量 或 原因 是 错综复杂 的 ， 则 需要 能 力 更 强 的 复杂 技术 。 


15.4.2 源码 级 调试 工具 


特定 技术 通常 无 法 为 bug 分 析 提 供 足够 的 信息 ， 此 时 程序 员 会 选用 一 个 “源码 级 ”(source- 
level) 调试 工具 来 孤立 bug。 这 类 工具 的 特点 是 : 程序 可 以 在 受 控 情况 下 执行 ， 即 借助 该 工具 程序 
员 可 以 控制 /查看 程序 执行 的 各 种 信息 。 例 如 ， 调 试 工具 可 以 控制 程序 一 条 一 条 语句 地 单 步 执 行 ， 
并 随时 查看 任意 一 个 变量 的 值 ( 即 内 存 地址 和 寄存 器 内 容 ， 假 如 选择 查看 的 话 ) 。 事 实 上 ， 源 码 级 
调试 工具 和 第 6 章 介绍 的 LC-3 调 试 工具 很 相似 ， 惟 一 的 区 别 是 源码 级 调试 工具 操作 的 是 高 级 语言 ， 
而 LC-3 调 试 工具 操作 的 是 机 器 语言 。 

当 源 码 级 调试 工具 用 于 一 个 程序 上 时 ， 被 调试 的 程序 必须 已 编译 ， 同 时 编译 器 在 编译 源码 之 
时 会 对 可 执行 代码 做 一 些 扩充 ， 即 在 执行 代码 中 加 入 足够 的 辅助 信息 以 便 协 助 调试 工具 工作 。 在 
其 他 时 候 ， 调 试 工具 将 需要 从 编译 过 程 获 得 信息 ， 以 便 将 每 个 机 器 语言 指令 和 对 应 的 高 级 语言 
序 语 名 关联， 此外， 调试 工具 还 需要 变量 名 及 其 内 存 位 置 的 相关 信息 (如 符号 表 )， 以 便 程序 员 可 
以 用 源 代 码 中 的 变量 名 来 查看 各 个 变量 的 取 值 。 

许多 源码 级 调试 工具 都 很 有 效 且 各 有 各 的 用 户 接口 。 在 UNIX 和 Windows 平 台 上 ， 有 很 多 可 用 
的 源码 级 调试 器 ， 各 自 拥有 自己 的 操作 特点 。 例 如 ，gdb 就 是 一 个 大 多 数 基于 在 UNIX 平 台 的 、 免 
费 源码 级 调试 工具 。 所 有 调试 器 均 支 持 监测 程序 执行 的 一 组 核心 的 必 备 操作 。 其 中 ， 许 多 核心 操 
作 其 功能 和 LC-3 调 试 工具 的 调试 特点 很 类 似 。 本 书 的 重点 是 介绍 其 中 的 核心 操作 ， 而 不 是 用 户 接 
口 ， 大 多 数 调 试 器 中 均 支 持 这 些 核 心 操作 。 

核心 调试 工具 命令 可 以 分 为 两 类 : (1) 控制 操作 ， 用 于 控制 程序 的 执行 。(2) 查看 操作 ， 用 
于 执行 时 查看 变量 或 内 存 内 容 。 


15.4.8 WA 


断 点 《Breakpoints) 是 指 程序 执行 过 程 中 的 一 些 临 时 停顿 “特殊 点 ”， 以 便 我 们 检查 或 修改 程 
序 的 状态 。 当 代码 存在 问题 的 时 候 一 个 点 对 我 们 检查 程序 的 执行 状态 非常 有 用 。 

例如 ， 我 们 可 以 在 源 代码 的 某 一 行 或 特定 函数 入 口 处 设置 断 点 。 当 程序 执行 到 断 点 处 时 ， 整 
个 程序 就 像 “ 冻 结 ” 一 样 停 住 了 ， 我 们 可 以 查看 程序 在 这 一 状态 中 的 各 种 信息 。 怎 样 添 加 断 点 
呢 ? 这 取决 于 调试 工具 的 特定 用 户 接口 。 有 些 调试 工具 只 要 在 代码 行 上 点 击 一 下 鼠标 即 可 ， 而 有 
的 调试 工具 则 要 求 在 命令 行 下 输入 指定 的 代码 行 号 来 添加 断 点 。 

有 时 候 仅 当 某 条 件 为 “ 真 ”时 暂停 程序 的 执行 很 有 用 。 这 种 “条 件 断 点 ”可 用 于 孤立 特定 的 
状态 ， 此 时 我 们 猜想 有 一 个 bug 要 发 生 。 例 如 ， 我 们 猜想 PerformCalculation 国 数 在 输入 参数 等 于 16 
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的 时 候 可 能 工作 不 正确 ， 则 可 以 在 如 下 代码 中 添加 条 件 断 点 仅 在 条 件 为 “x = 16” 的 时 候 让 程序 停 
下 来 。 


for (x 0; x < 100; x++) 
PerformCalculation(x); 


另外 , 我 们 可 以 在 特定 条 件 为 “ 真 ” 的 地 方 设置 一 个 观察 点 (watch point) 来 暂停 程序 的 执行 。 
例如 ， 我 们 可 以 用 一 个 watch point 暂 停 程 序 执行 ， 当 变量 Lastitem 等 于 与 4 时 。 该 断 点 可 以 在 执行 
任意 一 条 使 LastItem = 4 的 语句 时 触发 测试 工具 ， 暂 停 程序 的 执行 。 与 breakpoint ( 断 点 ) 不 同 的 是 ， 
watchpoint 不 与 任何 一 条 代码 有 关 ， 但 可 以 作用 于 所 有 语句 行 。 

2. 单 步 执行 

一 旦 调试 器 遇 到 断 点 (或 watch point) 的 时 候 ， 它 将 临时 挂 起 程序 ,等 待 我 们 输入 下 -一 个 命令 。 
此 时 ， 我 们 可 以 检查 程序 的 状态 ， 如 变量 的 值 ， 或 者 继续 执行 程序 。 

从 一 个 断 点 开始 一 次 仅 执行 一 条 语句 的 操作 常常 很 有 用 ， 该 常用 操作 过 程 称 为 单 步 执行 
(single-stepping)。LC-3 调 试 工具 就 具备 这 么 一 个 命令 ， 它 可 以 一 次 只 执行 一 条 指令 ， 这 与 源码 级 调 
试 工具 的 单 步 执 行 功能 是 类 似 的 。 单 步 命令 执行 当前 语句 行 之 后 ， 则 再 次 挂 起 程序 。 大 多 数 调试 工 
具 此 时 会 在 另 一 个 窗口 中 将 对 应 的 源 代码 显示 出 来 ，( 以 便 我 们 监视 当前 程序 执行 到 什么 地 方 了 。 对 
”一 个 程序 来 说 单 步 执行 非常 有 用 ， 特 别 是 在 我 们 猜测 bug 可 能 出 现 的 地 方 设置 断 点 很 有 用 ， 此 时 我 们 
可 以 在 猜测 位 置 附近 设置 一 个 断 点 ， 然 后 从 断 点 处 开始 单 步 执 行 序 ， 并 查看 变量 的 值 是 否 正确 。 

单 步 最 常见 的 使 用 方式 是 : 验证 程序 控制 流 是 否 如 我 们 所 和 希望。 例如， 可 以 单 步 执行 一 个 特 
环 ， 从 检查 总 的 循环 次 数 是 否 正 确 ， 或 者 单 步 执行 过 else 语 句 ， 以 验证 分 支 条 件 是 否 设置 正确 。 

单 步 执行 方式 很 多 ， 它 可 以 一 步 跳 过 一 个 函数 ， 也 可 以 直接 跳 至 循环 的 最 后 一 轮 。 这 些 单 步 
执行 方式 使 得 我 们 可 以 快速 执行 猜想 没有 错误 存在 的 代码 段 ， 并 如 期 暂停 在 断 点 处 ， 实 现 断 点 和 
错误 点 的 代码 检测 。 

3. 显示 变量 内 容 

调试 艺术 更 重要 是 收集 信息 ， 以 及 有 逻辑 性 地 减少 源 代码 中 的 错误 。 调 试 工具 是 当 调 试 大 型 
程序 时 候 能 选择 要 收集 的 信息 的 工具 。 当 程序 在 断 点 处 暂时 挂 起 的 时 候 ， 我 们 可 以 通过 查看 bug 相 
关 的 变量 内 容 来 收集 信息 。 一 般 来 说 ， 我 们 可 以 在 断 点 查看 该 程序 的 所 有 执行 状态 ， 包 括 变量 、 
内 存 、 栈 空间 、 甚 至 寄存 器 的 内 容 。 怎 样 做 到 这 一 点 ， 由 调试 工具 指定 。 有 些 调试 工具 允许 用 鼠 
标 指向 源 代 码 窗口 中 的 某 个 变量 ， 触 发 窗口 弹出 ， 以 显示 读 变 量 的 当前 值 ， 而 有 些 调 试 工具 则 要 
求 你 手工 输入 命令 ， 来 指定 待 查看 变量 的 名 字 。 

我 们 建议 你 要 多 熟悉 自己 用 的 源码 调试 工具 。 本 章 结尾 我 们 给 出 几 个 问题 ， 以 帮助 你 获得 很 
有 用 的 调试 工具 使 用 的 若干 经 验 。 


15.5 正确 的 编程 方法 


懂得 怎样 测试 和 调试 代码 是 成 为 一 个 优秀 程序 员 的 必 备 条 件 ， 但 对 于 一 个 伟大 的 程序 员 来 说 
更 重要 的 是 要 知道 怎样 避免 错误 发 生 。 不 良 的 编程 习惯 很 容易 导致 bug。 学 习 一 些 防范 出 错 的 编程 
技术 将 大 大 缩短 代码 的 调试 时 间 。 记 住 ! 与 bug 的 战斗 存在 于 任何 一 行 代码 开始 编写 之 前 。 下 面 介 
绍 三 种 在 错误 发 生前 就 能 将 错误 捕捉 住 的 方法 。 


15.5.1 明确 规格 说 明 


很 多 bug 的 起 因 是 程序 规格 说 明 (specification) 的 定义 差 或 不 完备 。 有 时候 软 件 规格 说 明 没有 
完全 阐述 清楚 程序 所 有 可 能 工作 的 场景 ， 因 此 留 下 了 一 些 条 件 要 程序 员 自 己 来 解释 。 例 如 ， 第 14 
章 的 求 阶乘 的 例子 : 图 14-2 的 代码 是 求 用 户 输入 数字 的 阶乘 。 你 可 以 想象 该 程序 的 设计 说 明 是 这 样 
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描述 的 “ 写 一 个 程序 ， 从 键盘 接 人 数字 ， 并 求 其 阶乘 ”。 正 如 所 见 ， 这 样 的 说 明 描述 是 不 完备 的 ， 
因为 如 果 我 们 输入 一 个 负数 呢 ? 或 是 输入 零 呢 ? 或 是 我 们 输入 一 个 很 大 的 数字 导致 溢出 呢 ? 面 对 
这 些 情 况 ， 所 写 出 的 代码 必然 不 完全 正确 ， 因 此 存在 bug。 为 了 改 这 类 错 ， 就 需要 修改 程序 规格 说 
明 ， 使 得 程序 在 遇 到 输入 为 零 或 小 于 零 的 值 ， 或 阶乘 结果 n!>2”( 即 暗示 nt 必须 小 于 等 于 31)。 下 面 
的 代码 中 ， 我 们 对 第 14 章 的 Factorial 函 数 做 了 修改 ,添加 了 输入 范围 检查 代码 。 一 旦 输入 参数 超出 
正确 的 操作 范围 ， 程 序 将 打印 一 个 警告 信息 并 返回 “一 1”。 


1 int Factorial (int n) 


{ 


2 

3 int i; /* Iteration count */ 
4 int result = 1; /* Initialized result */ 
5 

6 /* Check for legal parameter values */ 

7 if (n< 1 |[ n > 31) { 

8 printf ("Bad input. Input must be >= 1 and <= 31.\n"); 
9 return -1; 
10 } 
11 
12 for {i = 1; i «- n; i++) /* Calculates factorial */ 
13 result = result * i; 
14 
15 return result; /* Return to caller */ 


16 ] 
15.5.2 模块 化 设计 


函数 是 非常 利于 扩展 编程 语言 的 功能 。 通 过 函数 ， 我 们 可 以 方便 地 为 特定 的 编程 任务 添加 新 
的 操作 和 构件 。 通 过 这 种 方式 ， 很 自然 地 使 得 我 们 的 程序 具有 模块 化 的 模式 。 

一 且 完 成 一 个 函数 ， 我 们 就 可 以 对 它 独立 测试 (如 : HAMR) 判断 它 的 工作 是 否 如 期 完成 。 
相 比 于 完整 的 程序 来 说 ， 一 个 典型 的 函数 仅 完成 一 个 小 任务 。 与 整个 程序 相 比 ， 它 更 容易 测试 。 
一 旦 我 们 独立 测试 和 调试 了 每 个 函数 ， 就 很 高 集成 它们 实现 整个 程序 的 设计 。 

模块 化 设计 概念 在 系统 设计 中 很 重要 ， 即 系统 的 构建 可 基于 一 些 简 单 的 、 已 预测 试 的 、 工 作 
正常 的 组 件 。 后 面 的 章节 将 介绍 库 函 数 (library) 的 概念 。 库 函数 是 一 组 已 预测 试 的 组 件 的 集合 。 
所 有 程序 员 可 以 基于 库 函 数 编写 自己 的 程序 代码 。 由 于 基于 模块 设计 的 种 种 好 处 ， 现 代 编 程 “ 严 
重地 ”依赖 库 函 数 。 不 仅 是 在 软件 设计 中 而 且 在 电路 、 硬 件 、 以 及 计算 机 系统 的 各 个 层面 的 设计 
上 均 使 用 了 模块 化 设计 思想 。 


15.5.3 预防 错误 式 编程 


任何 一 个 老练 的 程序 员 都 有 方法 来 防止 bug“ 让 入 ”他 们 的 代码 。 他 们 设计 代码 的 方法 是 在 设 
计 阶段 就 尽量 消除 能 猜 到 的 影响 程序 的 错误 发 生 ， 即 他 们 边 编程 边 预防 错误 发 生 。 下 面 列 出 常见 
的 预防 错误 技术 ， 请 在 编程 时 尽量 采纳 它们 ， 以 避免 错误 出 现 : 

"注释 代码 : 在 代码 中 写 上 有 关 它 的 注释 。 代 码 文档 的 作用 不 仅仅 是 告诉 别人 你 的 代码 是 怎 

么 工作 的 ， 同 时 也 是 你 重新 审核 和 反思 你 自己 的 代码 的 过 程 。 在 这 个 过 程 中 ， 你 可 能 发 现 你 

疏漏 了 一 些 特例 情况 或 操作 条 件 的 处 理 ， 而 这 些 疏 漏 可 能 酿 成 大 祸 。 

"采用 统一 的 编码 格式 : 例如 ， 对 齐 左 括号 和 右 括号 ， 这 个 习惯 会 大 大 减少 你 犯 “ 因 缺少 括 

号 引起 的 错误 "。 按 这 一 方法 ， 代 码 中 还 要 注意 采用 统一 的 变量 名 命名 方法 ， 变 量 名 应 该 能 

传递 、 暗 示 变 量 的 内 容 。 

“不 做 任何 假设 ， 写 代码 时 很 容易 作 简单 、 无 意义 假设 ， 但 是 这 些 假 设 最 终 会 引发 错误 。 例 

如 ， 写 函数 的 时 候 ， 我 们 会 假设 输入 参数 总 是 落 在 一 定 的 范围 内 。 可 如 果 这 个 假设 没有 落实 
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到 设计 说 明 中 ， 则 已 埋 下 了 错误 隐患 。 写 代码 时 要 避免 任何 假设 一 -或 者 至 少 通过 断言 和 现 
场 检查 来 指明 哪些 假设 不 成 立 。 

“避免 全 局 变量 : 当 有 些 很 有 年 头 的 程序 员 非 常 喜欢 大 量 使 用 全 局 变量 时 ， 许 多 软件 工程 师 
大 声呐 喊 尽 量 不 要 使 用 它们 。 全 局 变量 可 能 简化 一 些 编程 任务 ， 但 它们 会 使 代码 难以 理解 和 
扩展 ， 而 且 一 旦 发 现 bug 很 难 分 析出 错 原因 。 

“依赖 编译 器 : 大 多 数 好 的 编译 器 都 提供 了 一 个 选项 ， 它 可 以 对 你 有 疑点 代码 做 仔细 的 检查 。 
例如 ， 是 否 用 赋值 操作 符 “=” 代 替 了 相等 操作 符 “==”。 当 这 些 检查 没 通过 对， 编译 器 会 
帮 着 标识 出 常见 的 编译 错 。( 如 : 变量 未 初始 化 ) 或 “对 常见 的 不 可 用 的 代码 结构 进行 检查 ， 
如 果 你 用 的 是 gcc 编 译 器 ， 可 以 用 “gcc -Wall” 使 编译 器 列 出 所 有 警告 信息 。 

这 里 提 到 的 预防 技术 特别 适用 于 我 们 之 前 讨论 过 的 编程 概念 。 在 后 面 的 章节 中 ， 我 们 在 介绍 

一 些 新 的 编程 概念 之 后 ， 还 将 讨论 如 何在 编写 程序 时 使 用 针对 于 它们 的 预防 技术 。 


15.6 小 结 


本 章 主要 介绍 了 有 关 发 现 和 修改 代码 中 bug 的 方法 。 现 代 的 系统 对 软件 的 依赖 越 来 越 多 ， 而 现 
代 软 件 也 变 得 非常 复杂 。 为 了 避免 出 现 因 软件 bug 而 发 生 的 诸如 “手机 死机 ”、“ 飞 机 失控 ”等 问题 ， 
软件 与 规格 说 明 紧密 地 相 一 致 显得 非常 重要 。 本 章 涉 及 的 关键 概念 包括 ; 

WR: 在 代码 中 发 现 bug 并 不 容易 ， 特 别 是 当 程序 很 大 时 。 软 件 工程 师 通 常 采用 系统 的 测试 
方法 找 出 软件 的 错 。 黑 盒 法 测试 法 被 用 来 验证 程序 的 执行 是 否 和 说 明 一 致 ， 而 白 盒 测试 法 则 
被 用 来 有 目的 地 测试 程序 内 部 结构 ， 确 保 每 一 行 代码 都 经 受 了 一 定 级 别 的 测试 。 

， 调试 : 调试 错误 需要 具备 获取 信息 和 推断 源 代码 错误 的 能 力 。 当 一 些 特定 的 测试 技术 允许 
我 们 获得 少许 有 关 错 误 的 信息 时 ， 源 码 级 调试 工具 已 成 为 软件 工程 中 大 多 数 调试 任务 的 首 
选调 试 工具 ， 它 使 得 程序 员 可 以 在 可 控 的 环境 下 执行 程序 ， 并 在 执行 过 程 中 查看 各 种 数值 
和 状态 。 

* 正确 的 编程 方法 学 : 有 经 验 的 程序 员 总 是 在 写 第 一 行 代码 的 时 候 尽量 避免 bag。 但 通常 bug 
的 真正 起 源 是 程序 的 设计 说 明 ， 而 明确 规格 说 明 中 各 类 不 严谨 的 条 件 ， 将 有 效 地 帮助 削减 编 
写 出 来 的 代码 中 的 错误 ， 模 块 化 设计 使 大 程序 的 编写 以 简单 的 已 预先 测试 过 的 函数 为 基础 ， 
从 而 降低 了 测试 大 程序 时 面临 的 困难 。 最 后 预防 错误 或 编程 技术 将 帮助 大 量 减少 导致 错误 代 
码 出 现 的 情况 发 生 。 


15.7 ”习题 


15.1 以 下 每 个 程序 中 都 存在 一 个 错误 ， 试 做 尽 可 能 少 的 改动 来 纠正 程序 中 的 错误 。 它 们 分 别 通 过 
不 同 的 方法 对 1 到 10 的 整数 求 和 。 
a. 


#inciude «stdio.h» 
int main() 
int i = 1; 
int sum = 0; 


while (i « 11) ( 
sum = sum + i; 
++i; 
printf ("%d\n", sum); 
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b. 


#include «stdio.h» 
int main() 
int i; 
int sum = 0; 
for (i = 0; i >= 10; ++i) 


sum = sum + i; 
printf("*dWMn", sum); 


} 
c. 
*include <stdio.h> 
int main() 
{ 
int i = 0; 
int sum = 0; 
while (i «- 11) 
Sum = sum + i++; 
printfí("$dWMn", sum); 
) 
d. 


#include <stdio.h> 
int main() 


for (i - 0; i «- 10;) 
sum = sum + ++i; 
printfí("tdWin", sum); 


} 
15.2 下 面 的 程序 存在 语法 错误 ， 因 而 编译 不 通过 。 假 设 其 中 所 有 变量 都 事先 声明 了 ， 试 修改 程序 
段 中 导致 编译 不 通过 的 错误 : 


a. 
i = 0; 


j= 0; 
while (i < 5); 


j=j+ 1; 
i = j >> 1; 
} 
b. 
if (cont == 0) 
a = 2; 
b=3 
else 
a = -2; 
b = -3; 
c. 


#define LIMIT 5; 


if (LIMIT) 
printf ("True"); 
else 
printf("False"); 


15.3 下 面 的 C 语 言 程序 代码 从 用 户 键盘 输入 的 所 有 正 整数 中 找 出 最 小 值 。 用 户 通过 输入 “-1” 表 


示 和 输入 结束 。 数 据 输 入 完毕 并 处 理 完 之 后 ， 输 出 最 小 值 。 但 是 代码 中 存在 一 个 错误 ， 试 找 出 
错误 并 阐述 解决 思路 和 方法 。 如 果 需 要 的 话 你 可 以 用 一 个 源码 级 调试 工具 来 帮助 查找 错误 。 


#include «stdio.h» 
int main() 


int smallestNumber - 0; 
int nextInput; 
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/* Get the first input number */ 
scanf("$d", &nextInput); 
/* Keep reading inputs until user enters -1 */ 
while (nextiInput != -1) 
if (nextInput « smallestNumber) 


smallestNumber = nextInput; 
scanf ("$d", &nextInput); 


printf("The smallest number is $d\n", smallestNumber); 


) 

15.4 ”下面 的 程序 从 键盘 读 和 一行 字 符 , 然后 只 回 显 其 中 的 字符 和 数字 (当然 空格 算 字 符 也 回 显 的 ) 。 
例如 ， 输 入 如 果 是 “Let”s meet at 6:00pm”， 则 回 显 应 该 是 “Lets meet at 600pm”。 但 是 ， 
程序 中 存在 一 个 bug， 你 能 发 现 它 并 改正 该 错误 吗 ? 


#include <stdio.h> 
int maint) 


char echo - '0'; 
while (echo != ‘\n’) { 
scanf("$c", &echo); 
if ((echo > 'a' [| echo < 'z') && 
(echo > 'A' || echo < 'z')) 


printf("tc", echo); 
} 
} 


, > mn ; — 4 
15.5 ”试用 源码 级 调试 工具 监视 下 面 程序 的 运行 : 
#include <stdio.h> 
int IsDivisibleBy(int divisor, int quotient); 
int main() 
int i; /* Iteration variable */ 
int j; /* Iteration variable */ 
int f; /* The number of factors of a number */ 
"for (i = 2; i < 1000; i++) { 
f = 0; 
for (j = 2; j < i; j++) { 
if (IsDivisibleBy(i, j)) 
E++; 


printf ("The number &d has %d factors\n", i, f); 


) 


int IsDivisibleBy(int divided, int divisor) 


{ 


if (dividend % divisor == 0) 
return 1; 
else 
return 0; 
} 
并 完成 以 下 任务 


a. 在 国 数 EDivisibleBy 开 始 处 设置 断 点 ， 并 检查 前 10 次 调用 的 参数 值 ， 它 们 是 什么 ? 记录 下 
来 。 
b. 试 给 出 当 内 循环 for 结 束 后 ， 以 及 当 变 量 ;等 于 660 时 ， 变 量 /的 值 ? 
c. 试 分 析 ， 指 出 该 程序 如 何 修改 效率 更 高 。 提 示 : 监视 当 函 数 IsDivisibleBy 返 回 值 为 1 的 时 
候 给 参数 输入 的 数值 。 

15.6 使 用 源码 级 调试 工具 ， 确 定 在 函数 Mystery 的 参数 取 什么 值 时 ， 该 函数 会 返回 零 值 ? 
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#include <stdio.h> 
int Mystery(int a, int b, int c); 


int main() 


{ 


int i; /* Iteration variable */ 
int j; /* Iteration variable */ 
int k; /* Iteration variable */ 
int sum - 0; /* running sum of Mystery */ 


for (i = 100; i > 0; i--) { 
for (j =s 1; j < i; j++) { 
for {k = j; k < 100; k++) 
sum = sum + Mystery (i, j, X); 


) 


int Mystery(int a, int b, int c) 


{ 


Static max = 1000; 
int out; 


Out = 3*aàa*a + 7*a - 5*b*b + 4*b + 5*c ; 


return out; 


} 
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1577 如 下 程序 是 一 个 小 型 航线 (只 有 一 架 飞机 ) 的 订 票 系统 ， 该 飞机 有 SEATS 个 乘客 座位 。 该 程 
序 接收 来 自 网 上 的 订 票 请 示 。 命 令 R 代 表 “ 请 求 座 位 ”， 如 果 有 空位 则 预定 成 功 ， 如 果 没 有 
位 置 了 ， 则 订 票 申请 失败 。 随 后 ， 预 定 成 功 的 旅客 通过 已 命令 购 票 。 这 意味 着 每 个 局 命 令 之 
前 都 必须 先 有 个 R 命 令 ; 但 反之 ， 每 个 R 命 令 并 不 一 定 产生 购 票 操作 (MPRE). MEXR 
表 结 束 程序 。 但 是 ， 在 这 个 程序 中 存在 一 个 致命 的 设计 错误 。 请 找 出 错误 ， 并 予以 纠正 。 


Hinclude <stdio.h> 
#define SEATS 10 


int main() 


{ 


int seatsAvailable = SEATS; 
char request = '0'; 


while (request !- 'X') { 
Scanfí("$c", &request); 


if (request -- 'R') { 
if (seatsAvailable) 
printf ("Reservation Approved! Mn"); 


else 
printf("Sorry, flight fully booked.Wn"); 


if (request == 'P:) { 
seatsAvailable--; 
printf("Ticket purchased! Wn"); 


) 
printf("Donei &d seats not soldWMn", seatsAvailable); 


) 


第 16 章 ”指针 和 数组 


16.1 概述 


本 章 将 介绍 (实际 上 是 再 次 介绍 ) 两 个 简单 但 功能 非常 强大 的 编程 构件 一 一 指针 和 数组 。 在 纺 
写 LC-3 汇 编程 序 时 ， 我 们 就 使 过 指针 和 数组 。 现 在 讨论 的 则 是 怎样 在 C 语 言 里 测试 它们 。 

指针 是 内 存 对 象 (如 变量 ) 的 简单 地 址 。 用 指针 ， 我 们 可 以 间接 访问 这 些 对 象 ， 它 有 一 些 很 
有 用 的 功能 。 例 如 ， 使 用 指针 ， 使 得 函数 可 以 修改 调用 者 传递 进来 的 参数 ， 使 用 指针 ， 还 可 以 在 
程序 运行 过 程 中 ， 使 复杂 的 数据 结构 增长 或 缩小 〈 像 运行 时 栈 的 变化 一 样 ) 。 

数组 是 内 存 中 一 组 用 来 存储 数据 序列 的 连续 的 空间 ， 例 如 ， 在 本 书 前 半 部 的 少数 LC-3 代 码 中 ， 
我 们 曾 用 一 个 有 序 排列 的 字符 序列 代表 一 个 字符 文件 。 我 们 称 这 样 的 字符 序列 为 “字符 数组 (array )”。 
为 了 访问 数组 中 的 某 个 特定 数据 项 ， 我 们 还 需要 指定 我 们 所 要 的 元 素 。 稍 后 我 们 将 看 到 ，af[4] 代 表 
的 是 a 数组 的 第 5 个 元 素 〈 因 为 起 始 元 素 的 编号 为 0) 。 数 组 之 所 以 有 用 ， 是 因为 通过 它 我 们 可 以 处 理 
一 组 数据 ， 如 向 量 、 和 矩阵 、 列 表 和 字符 串 等 ， 这 些 对 象 自然 地 表示 了 真实 世界 的 某 些 对 象 。 


16.2 指针 


我 们 以 一 个 经 典 的 指针 例子 开始 我 们 的 讨论 。 图 16-1 所 示 的 C 程 序 中 ， 浮 数 Swap 的 作用 是 交换 
两 个 参数 的 数值 。main 函 数 和 将 两 个 参数 valueA 和 valueB 传 递 给 Swap 函 数 ， 其 中 valueA = 3, valueB 
= 4。 当 控制 权 从 Swap 函 数 返 回 到 main 函 数 时 ， 我 们 期 望 valueA 和 valueB 的 值 已 经 互 换 。 但 是 ， 当 
我 们 编译 并 执行 该 代码 之 后 ， 却 发 现 两 个 变量 的 值 并 未 改变 (没有 相互 交换 )。 

#include <stdio.h> 
void Swap(int firstVal, int secondVal); 
int main() 


int valueA - 3; 
int valueB - 4; 


printf("Before Swap "); 
printf("valueA = td and valueB = $dWMn", valueA, valueB); 


Swap(valueA, valueB); 
printf("After Swap "); 


printf("valueA = &d and valueB = $&dWMn", valueA, valueB); 


} 


void Swap(int firstVal, int secondVal) 


int tempVal; /* Holds firstVal when swapping */ 


tempVal - firstVal; 
firstVal = secondVal; 
secondVal = tempVal; 





图 16-1 Swap 函 数 : 试图 交换 两 个 参数 的 值 
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让 我 们 看 看 Swap 函 数 执行 时 ， 栈 内 容 的 变化 ， 或 许 能 分 析出 其 中 的 问题 所 在 。 图 16-2 所 示 为 
运行 时 栈 的 状态 ， 表 示 的 是 函数 完成 前 栈 内 容 的 变化 ( 即 第 25 行 语句 已 执行 ， 但 还 未 真正 返回 
main 函 数 之 时 ) 。 我 们 发 现 ，Swap 已 改变 它 的 话 动 记录 中 firstVal 和 secondVal 参 数 的 局 部 量 数值 ， 
而 当 Swap 消 数 最 终 返 回 控制 权 给 main 函 数 之 时 ，Swap 的 活动 记录 已 从 栈 中 弹出 ， 这 些 被 改变 过 的 
数据 值 也 随 之 丢失 了 。 所 以 ， 从 main 函 数 角度 来 看 ， 两 个 值 并 未 被 交换 。 程 序 有 bug。 





x0000 、 
运行 时 栈 空间 


main 邱 数 的 帧 指针 
返回 main 函 数 的 地 址 















firstVal | 
secondVal 
valueB | 
ValueR 
main 函 数 的 活动 记录 


xFFFF 
图 16-2 Swaph $ EZB I f ha ajmain A CZ iis £15] B) P E 


在 C 语 言 中 ， 调 用 国 数 总 是 把 数据 值 传递 给 被 调用 函数 的 参数 ，C 语 言 将 函数 调用 语句 中 出 现 
的 参数 看 做 是 一 个 表达 式 ， 并 计算 表达 式 调用 之 后 将 计算 结果 压 人 运行 时 的 栈 实 现 表达 式 数值 向 
被 调用 函数 的 传递 。 如 果 Swap 要 修改 传递 给 它 的 参数 ， 它 必然 需要 访问 调用 函数 的 活动 记录 ， 这 
意味 着 它 必 须 访问 参数 存放 空间 ， 以 修改 它 的 值 。 即 Swap 函 数 需要 访问 的 是 valueA 和 main 函 数 中 
的 地 址 (以 修改 它们 的 值 )。 正 如 在 后 面 几 节 将 看 到 的 ， 指针 和 它 相 关 的 运算 符 可 以 满足 这 个 
16.2.1 声明 指针 变量 


指针 变量 的 内 容 是 一 个 内 存 对 象 的 地 址 (如 变量 )。 或 者 说 ， 指 针 指向 它 的 内 容 指 到 的 变量 。 
与 指针 变量 相关 的 另 一 个 要 素 ， 是 它 所 指向 的 对 象 的 类 型 (type)。 例 如 ， 一 个 整 型 指针 变量 指向 
一 个 整 型 变量 。 在 C 语 言 中 ， 指 针 变 量 的 声明 语句 如 下 所 示 : 

int *ptr; 

其 中 ， 被 声明 变量 名 为 ptr， 它 指向 的 是 一 个 整数 。 星 号 (*) 代表 之 后 的 标识 符 是 一 个 指针 变 
量 名 。C 程 序 员 常常 说 : ptr 是 int * 类 型 的 变量 。 类 似 的 ， 我 们 也 可 以 声明 . 


char *cp; 
double *dp; 


其 中 ， 变 量 cp 指向 一 个 字符 ，dp 指 向 一 个 双 精 度 浮 点 数 。 指 针 变 量 的 初始 化 方式 和 其 他 类 型 
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变量 相似 。 如 果 指 针 变 量 被 声明 为 局 部 变量 ， 它 将 不 会 被 自动 初始 化 。 
开始 ， 使 用 符号 “*” 声 明 指针 变量 的 语法 看 起 来 有 些 奇 任 。 但 是 ， 如 果 看 过 所 有 的 指针 操作 
符 之 后 ， 我 们 就 能 明白 语法 背后 的 原因 了 。 


16.2.2 指针 运算 符 S 


在 C 语 言 中 ， 指 针 相 关 的 运算 符 有 两 个 : 地址 运算 符 (&&)、 闻 接 引用 运算 符 (*)。 

1. 地 址 运算 罕 (&) 

地 址 运算 符 〈 人 ) ， 生 成 一 个 它 的 操作 数 的 内 存 地 址 ， 该 操作 数 肯 定 是 一 个 内 存 对 象 ， 如 变量 。 
如 下 代码 序列 中 ， 指 针 变 量 ptr 将 指向 整 型 变量 object。 在 第 二 个 赋值 语 旬 右边 的 表达 式 将 生成 
object 的 内 存 地 址 。 


int object; 
int *ptr; 


object - 4; 
ptr = &object; 


让 我 们 看 看 这 段 LC-3 汇 编 代码 。 其 中 ， 两 个 声明 的 变量 都 是 局 部 变量 ， 可 以 被 放 入 栈 空 间 。 
回顾 R5，( 基 地 址 指针 )， 它 指向 声明 的 第 一 个 局 部 变量 ， 这 种 情况 下 是 object。 


AND RO, RO, #0 ; Clear RO 

ADD RO, RO, #4 i RO = 4 

STR RO, R5, #0 H Object = 4; 

ADD RO, R5, #0 ; Generate memory address of object 
STR RO, R5, d-1 ; Ptr = &object; 


图 16-3 给 出 了 “ptr = 人 object ”语句 执行 之 后 ， 函 数 中 代码 包含 的 活动 记录 的 快照 。 为 了 让 图 
示 更 加 形象 ， 我 们 给 出 了 每 个 内 存 空间 的 地 址 (随意 假 
定 起 始 地 址 为 xEFF0)。 而 此 时 ， 基 地 指针 Rs 指向 的 是 ps 


xEFF2。 注 意 ，object 的 内 容 是 数值 4， 而 ptr 的 内 容 则 是 xEFFO| O | 
xEFF1| ^ xEFF2 |ptr 


ar na erre bject 
2. 间接 引用 符 (9) XEFF3 
第 二 个 指针 运算 符 被 称 为 “间接 引用 符 ” N | 
(indirection) 或 “ 解 引 用 符 ”(dereference)， 符 号 为 “*” xEFF5| | 


(发 音 为 “ 星 ”(staf))。 它 的 作用 是 允许 我 们 间接 地 访问 
内 存 对 象 的 数值 。 例 如 ， 表 达 式 “*ptr” 访 问 的 是 指针 
变量 ptr 所 指向 的 值 。 回 顾 前 例 ， *ptr 引 用 存储 在 变量 
object 中 的 值 。 所 以 ，*ptr 和 object 是 可 以 互 换 着 用 ， 我 
们 可 以 将 前 面 的 代码 修改 如 下 : 


int object; 
int *ptr; 


图 16-3 语句 ptr = &object 执 行 后 包含 
object 和 ptr 的 运行 时 栈 结构 


object = 4; 

ptr = &object; 

*ptr - *ptr « 1; 

也 就 是 说 ， 本 质 上 “*ptr = *ptr + 1;” fü "object = object + 1;” 是 等 价 的 。 与 其 他 变量 类 型 一 
样 ，*ptr 故 在 赋值 运算 符 的 不 同位 置 ， 代 表 的 含义 也 不 同 。 在 运算 符 右边 代表 该 地 址 中 的 值 (这 儿 
是 4)， 在 左边 代表 将 被 修改 的 变量 的 地 址 空间 (这儿 是 object 的 地 址 )。 让 我 们 再 看 代码 中 最 后 一 


- 


O 有关 “operator” 的 翻译 。 在 中 文 翻 译 中 ， 通 常 称 +、 一 、* 、/ 等 符号 为 “运算 符 ” ， 而 其 他 如 人 入、~、>> 等 
为 “操作 符 ”。 而 在 英文 中 ， 它 们 都 被 称 做 “operator”。 而 本 文 译 者 也 认为 ， 它 们 是 同类 的 ， 都 是 对 变量 
或 数据 对 象 的 一 种 运算 。 所 以 ， 在 此 将 “& ”和 “*” 都 译 为 运算 符 (而 不 是 操作 符 )。 一 一 译 者 福 


43841 fo Cn 283 





条 语句 对 应 的 LC-3 汇 编 代码 。 
LDR RO, R5, #-1 ; RO contains the value of ptr 
LDR Ri, RO, #0 n R1 <- *ptr 
ADD R1, R1, #1 n *ptr + 1 
STR R1, RO, #0 ; *ptr = *ptr + 1; 


注意 ， 如 果 C 语 言 的 最 后 一 条 语句 是 “object = object + 1;”， 所 对 应 的 汇编 代码 是 不 同 的 。 由 
于 使 用 了 指针 ， 编 译 器 将 为 等 号 右边 的 间接 引用 符 生 成 为 两 条 LDR 指 令 ， 一 个 加 载 ptr 所 指 的 内 存 
地 址 ， 另 一 个 则 独立 存储 在 那 了 ， 地 址 中 的 数值 。 而 针对 等 号 左边 的 间接 引用 ， 编 译 器 产生 了 一 
条 指令 “STR RI, RO, #0”。 如 果 这 条 语句 是 “object = *ptr + 1;”， 编 译 器 则 生成 “STR R1, R5, 80" 


指令 。 
16.2.3 ”指针 传递 一 个 引用 
使 用 地 址 符 和 间接 引用 符 ， 我 们 可 以 将 如 图 16-1 所 示 的 Swap 函 数 做 一 个 修改 ， 以 完成 两 个 输 
入 参数 值 的 互 换 。 图 16-4 所 示 是 修改 后 的 Swap 程序， 我 们 将 修改 后 的 Swap 函 数 命名 为 NewSwap。 
#include <stdio.h> 
void NewSwap (int *firstVal, int *secondVal); 
int main() 


int valueA - 3; 
int valueB - 4; 


printf("Before Swap "); 
printf("valueA = $d and valueB = %d\n", valueA, valueB); 


NewSwap(&valueA, &valueB]; 
printf("After Swap "); 


printf("valueA = %d and valueB = &dWn", valueA, valueB); 


) 


void NewSwap(int *firstVal, int *secondVal) 


int tempVal; /* Holds firstVal when swapping */ 


tempVal - *firstVal; 
*firstVal - *secondVal; 
*secondVal - tempVal; 





图 16-4 NewSwap 函 数 : 交换 了 两 个 参数 的 值 


修改 的 第 一 项 内 容 是 NewSwap 参 数 的 类 型 ， 即 将 它们 从 int 改 为 指向 整 型 的 指针 (nt *)。 换 名 
话说 ， 这 的 两 个 参数 是 两 个 可 以 被 交换 内 容 的 变量 的 地 址 。 在 NewSwap 函 类 中 ， 我 们 使 用 间接 引 
用 符 * 获 得 指针 所 指向 的 数值 。 

此 时 ， 当 从 main 函 数 调用 NewSwap 时 ， 我 们 需要 为 两 个 要 被 交换 的 变量 提供 内 存 地 址 ， 而 不 
是 它们 的 数值 (前 一 个 版 本 的 代码 中 给 的 是 数值 )。 在 此 关键 的 是 运算 符 “&”。 图 16-5 所 示 是 执行 
NewSwap 函 数 时 函数 的 各 条 指令 执行 时 的 栈 内 容 的 快照 。 图 16-5a~ 图 16-5c 三 个 子 图 分 别 对 应 第 23、 
24 和 25 行 语句 执行 后 的 栈 内 容 。 

通过 设计 ，C 语 言 用 数值 从 调用 函数 传递 信息 给 被 调用 函数 ， 即 计算 调用 语句 中 的 实数 表达 式 ， 
然后 把 计算 结果 传 给 被 调用 函数 。 但 是 ， 在 NewSwap 中 ， 我 们 用 地 址 符 “&&” 为 两 个 实 参 创建 调 
用 时 的 引用 。 把 参数 当成 引用 值 传递 时 ， 它 的 地 址 被 传人 被 调 函数 ， 为 保证 该 效果 实现 ， 实 参 必 
须 是 变量 或 其 他 内 存 对 象 【例如 ， 它 必须 有 一 个 地 址 ) 。 被 调用 函数 可 以 通过 间接 引用 符 CO. 访 
[a] (和 修改 ) 该 对 象 的 原始 值 。 
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图 16-5 NewSwap 国 数 执行 语句 
16.2.4 空 指 针 


有 时 候 ， 我 们 希望 一 个 指针 不 指向 任何 东西 。 为 什么 呢 ? 在 第 19 章 介绍 了 动态 数据 结构 (如 
链表 ) 之 后 ， 你 将 明白 其 中 原委 。 而 现在 ， 我 们 只 介绍 一 个 不 指向 任何 内 容 的 指针 。 我 们 称 一 个 
不 指向 任何 东西 的 指针 为 “ 空 指针 ”。 在 C 语 言 中 ， 我 们 用 以 下 赋值 完成 这 一 设计 ，: 

int *ptr; 

ptr = NULL; 

其 中 ,我 们 将 空 值 赋 给 了 指针 变量 ptr。 在 C 语 言 中 ，NULL 是 一 个 特别 定义 的 预 处 理 宏 ， 它 含 
有 一 个 “ 非 空 指针 ”不 可 能 包含 的 值 。 例 如 ， 在 特定 系统 中 ，NULL 可 以 被 定义 为 数值 0， 因 为 地 
址 0 不 存在 任何 有 效 的 内 存 对 象 。 


16.2.5 语法 
现在 可 以 回答 在 第 11 章 遗留 下 的 一 个 问题 了 。 我 们 曾 介 绍 过 IO 函数 库 中 的 scanf 函 数 ， 


scanf("td", &input); 

其 中 ，scanf 函 数 的 任务 是 ， 从 键盘 读 取 一 个 十 进 制 数 ， 并 赋值 给 变量 input， 它 所 需要 的 是 
input 的 地 址 (而 不 是 它 的 值 )。 为 此 ， 我 们 使 用 了 地 址 符 (&&)。 换 句 话说， 如 果 我 们 删 去 其 中 的 
地 址 符号 ， 程 序 的 运行 将 出 错 而 中 止 。 你 能 给 这 个 出 错 现象 一 个 合适 的 解释 吗 ? 即 为 什么 传递 的 
不 是 地 址 ，scanf 就 不 能 正常 工作 呢 ? 

下 面 ， 我 们 正式 介绍 指针 的 声明 语法 。 如 下 所 示 : 

type *ptr; 

其 中 ，type 代 表 任 意 已 定义 或 自 定义 的 数据 类 型 (如 int、char、double 等 )，ptr 代 表 任 意 合法 
(而 不 是 C 关 键 词 ) 的 变量 标识 符 。 该 声明 语句 表示 ， 我 们 声明 了 这 样 一 个 变量 ， 当 对 它 做 * 操 作 时 ， 
产生 的 结果 是 一 个 type 类 型 变量 。 即 *ptr 的 类 型 是 type 的 。 

同样 ， 我 们 也 可 以 将 一 个 函数 的 返回 值 声明 为 指针 类 型 (后 续 章节 将 介绍 它 的 用 处 ) 。 例 如 ， 
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我 们 可 以 声明 这 样 一 个 函数 : int *MaxSwap()。 

与 其 他 C 语 言 运算 符 一 样 ， 地 址 符 和 间接 引用 符 也 遵循 “优先 级 ”和 “关联 顺序 ”等 规则 。 有 
关 各 种 运算 符 之 间 的 优先 级 和 结合 规则 ， 如 表 12.5 所 示 。 值 得 一 提 的 是 ， 此 处 的 两 个 指针 运算 符 都 
拥有 很 高 的 优先 级 别 。 


16.2.6 指针 例 程 


本 节 最 后 ， 是 一 个 使 用 指针 的 示例 程序 。 如 果 我 们 要 写 一 个 程序 ， 计 算 整 型 除法 的 商 
(quotient) 和 余数 (remainder)。 即 计算 “被 除数 /除数 ”和 “被 除数 % 除 数 ”， 其 中 被 除数 和 除数 
的 值 都 是 整数 。 该 程序 的 结构 非常 简单 ， 只 有 一 个 顺序 结构 (也 就 是 说 ， 不 需要 条 件 、 循 环 等 高 
级 结构 )。 问 题 的 难度 在 于 ， 我 们 希望 让 一 个 C 函 数 同 时 返回 “ 商 ” 和 “余数 ”这 两 个 计算 结果 。 

通常 的 做 法 可 以 是 ， 通 过 国 数 返回 值 将 计算 结果 传 回 调用 者 。 但 是 ， 这 种 方法 一 次 只 能 返回 
一 个 输出 值 (如 “ 商 ”)。 例 如 ， 在 计算 除法 商 的 函数 结尾 处 ， 执 行 语句 “return dividend / divisor;" 
即 可 传 回 该 值 。 如 果 要 将 多 个 数值 返回 给 调用 者 ， 则 可 以 采用 “ 传 址 ”机 制 ( 即 指针 变量 )。 

如 图 16-6 所 示 ， 国 数 IntDivide 有 4 个 参数 : 2 个 整 型 、2 个 整 型 指针 。 在 该 函数 中 ， 我 们 将 第 1 
个 参数 x 与 第 2 个 参数 y 相 除 。 相 除 结果 的 整数 部 分 斌 给 quoPtr 指 向 的 内 存 位 置 ， 余 数 部 分 则 赋 给 
remPtr 指 向 的 内 存 位 置 。 


#include <stdio.h> 











int IntDivide(int x, int y, int *quoPtr, int *remPtr); 





int main() 





int dividend; /* The number to be divided */ 







int divisor; /* The number to divide by */ 
9 int quotient; /* Integer result of division */ 
10 int remainder; /* Integer remainder of division */ 
int error; /* Did something go wrong? */ 








printf ("Input dividend: "); 
14 scanf ("%d", &dividend); 

15 printf ("Input divisor: "); 
scanf("t*d", &divisor); 

















error = IntDivide (dividend,divisor, &quotient, &remainder); 





20 if (lerror) /* !error indicates no error */ 
21 printf("Answer: *d remainder d\n", quotient, remainder); 


22 else 
printf("IntDivide failed.\n"); 







int IntDivide(int x, int y, int *quoPtr, int *remPtr) 
27 { 











28 if (y != 0) { 

29 *quoPtr = X / y; /* Modify *quoPtr */ 
30 *remPtr = x $ y; /* Modify *remPtr */ 
31 return 0; 

32 } 

33 else 

34 return -1; 





} 
图 16-6 函数 IntDivide: 计算 整数 除法 的 整数 和 余数 部 分 。 如 果 除 数 为 0， 则 返回 -1 

其 中 ， 函 数 IntDivide 的 返回 值 代表 的 是 函数 本 身 的 执行 状态 ， 例 如 ， 如 果 除 数 是 0， 则 返回 数 

值 -1 (告诉 调用 者 函数 执行 失败 ) ， 如 果 返 回 0， 则 告诉 调用 者 计算 过 程 正 常 。 在 main 函 数 中 ， 则 

根据 该 返回 值 来 判断 商 和 余数 里 的 值 是 否 有 效 。 在 调用 者 和 被 调用 者 之 间 ， 通 过 返回 值 代表 被 调 
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用 函数 的 执行 状况 ， 是 个 非常 好 的 “预防 式 编程 ”习惯 ， 它 可 以 让 我 们 探知 函数 调用 过 程 中 的 各 
种 错误 原因 。 


16.3 ”数组 


假设 有 这 样 一 个 程序 ， 我 们 用 它 记 录 《计算 机 工程 》 课 程 中 50 位 学 生 的 考试 成 绩 。 存 储 成 绩 
数据 的 最 简单 方法 ， 就 是 声明 一 个 对 象 (如 examScore)， 并 将 50 个 不 同 的 整数 值 都 存储 在 其 中 。 
然后 ， 我 们 可 以 通过 索引 方式 ， 访 问 该 对 象 中 任 一 个 数据 项 (考试 成 绩 ) 。 所 谓 “ 索 引 ”， 就 是 该 
数据 项 距离 起 始 对 象 的 偏 移 量 。 例 如 ，examScore[32] 代 表 第 33 个 学 生 的 成 绩 (第 1 个 学 生 的 成 绩 是 
examScore[0]，examScore 是 一 个 整 型 数组 对 象 )。“ 数 组 ”， 是 指 连续 存储 在 内 存 中 的 一 组 数据 项 的 
集合 。 在 数组 内 ， 所 有 的 数据 项 拥有 相同 的 类 型 (hint, chart), 

数组 尤其 擅长 表示 一 组 连续 的 数值 序列 。 在 现实 中 ， 很 多 对 象 都 具有 这 样 的 性 质 ， 如 一 门 课 
程 的 学 生成 绩 。 无 疑 ， 数 组 在 计算 机 编程 中 ， 是 一 个 非常 重要 的 数据 结构 。 例 如 ， 一 个 程序 要 从 
键盘 依次 读 人 100 个 数 ， 然 后 按 从 小 到 大 的 升序 排列 它们 。 那 么 ， 数 组 是 最 佳 的 内 存 存 储 方式 。 如 
果 使 用 之 前 学 过 的 简单 变量 方式 来 存储 这 些 数 据 ， 几 乎 是 不 可 能 的 事情 。 


16.3.1 数组 声明 


首先 ， 看 一 下 C 语 言 的 数组 声明 方法 。 与 其 他 变量 一 样 ， 数 组 需要 一 个 相关 的 “类 型 "。 这 里 ， 
类 型 代表 存储 在 数组 中 各 数值 的 属性 。 如 下 所 示 ， 声 明 的 是 一 个 包含 10 个 整数 的 数组 : 

int grid[10]; 

其 中 ， 关 键 词 int 代 表 数 组 中 各 数据 项 的 类 型 是 整数 类 型 ，grid 代 表 数 组 名 ， 方 括号 ([]) 代表 
该 变量 是 一 个 数组 ，10 代 表 该 数组 包含 的 数据 项 个 数 (这 些 数据 项 在 内 存 中 是 连续 存放 的 ) 。 图 
16-7 所 示 是 grid 在 内 存 中 的 空间 分 配 情况 。 其 中 ， 第 1 个 元 素 grid[0] 被 分 配 在 最 低 内 存 地 址 处 ， 最 
后 一 个 元 素 grid[9] 被 分 配 在 最 高 内 存 地 址 处 。 

内 存 





图 16-7 grid 数 组 的 内 存 空 间 布 局 


其 中 ， 如 果 数 组 grid 是 一 个 局 部 变量 ， 则 该 空间 对 应 运行 时 栈 空 间 。 
随后 的 问题 是 ， 怎 样 存 取 数 组 中 的 不 同 数据 项 ? 如 图 16.7 所 示 ， 数 组 中 第 一 个 元 素 的 编号 为 0， 
最 后 一 个 元 素 的 编号 为 9。 所 以 ， 存 取 数 据 项 时 ， 只 需要 在 方 括号 中 标 出 该 数据 项 对 应 的 索引 编号 
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即 可 。 例 如 : 

grid[6] = grid[3] + 1; 

该 语句 表示 ， 读 取 grid 的 第 4 个 数据 项 〈 记 住 ，0 是 起 始 编号 ) ， 加 1， 然 后 将 结果 存 人 第 7 个 数 
据 项 。 下 面 是 该 语句 的 LC-3 汇 编 代 码 。 其 中 ， 假 设 grid 是 运行 时 栈 中 的 局 部 变量 ( 即 活动 记录 基 指 


针 R5 指 向 grid[9]) 。 
ADD RO, R5, #-9 ; Put the base address of grid into RO 
LDR R1, RO, #3 ; Ri «-- grid(3] 
ADD R1, R1, #1 ; R1 «-- grid[3] + 1 
STR Rl, RO, #6 ; grid[6] = grid[3] + 1; 


其 中 ， 第 一 条 指令 负责 数组 基地 址 的 计算 ( 即 grid[0] 的 地 址 )， 放 入 R0。 所 谓 “ 数 组 的 基地 
HE”, 就 是 该 数组 第 1 个 元 素 的 地 址 。 之 后 ， 通 过“ 基 地址 + 索引 ”的 方式 ， 就 可 以 访问 数组 中 的 

数组 之 所 以 功能 强大 ， 原 因 之 一 是 ， 索 引 值 ( 整 型 ) 可 以 是 一 个 C 表 达 式 。 如 下 所 示 ， 

gxid[x«1] = grid(x] + 2; 

该 语 名 对 应 的 LC-3 汇 编 代码 如 下 所 示 。 假 设 x 是 栈 空间 中 的 另 一 个 整 型 变量 (grid 上方)。 


LDR RO, R5, #-10 ; Load the value of x 


ADD R1, R5, 48-9 ; Put the base address of grid into R1 
ADD R1, RO, R1 ; Calculate address of gridíx] 

LDR R2, R1, #0 ;. R2 «-- grid[x] 

ADD R2, R2, #2 ; R2 «-- grid[x] + 2 


LDR R0, R5, 4-10 ; Load the value of x 

ADD RO, RO, #1 ; RO <-- XxX+1 

ADD R1, R5, #-9 ; Put the base address of grid into R1 
ADD R1, RO, R1 ; Calculate address of grid[x«1] 

STR R2, R1, #0 ; grid[x«1] = grid(x] + 2; 


16.3.2 数组 应 用 


我 们 先 介绍 一 个 简单 的 C 程 序 , “对 两 个 数组 相 加 ”。 所 谓 “ 两 个 数组 相 加 ”， 是 将 两 个 数组 的 
对 应 数据 项 分 别 相 加 。 其 中 ， 每 个 数组 代表 一 门 课 的 成 绩 表 。 如 果 要 计算 每 个 学 生 各 门 课 成 绩 的 
总 和 ， 则 执行 计算 如 “Total[i] = Exam1[i] + Exam2[fi"。 如 图 16-8 所 示 的 C 程 序 ， 读 人 两 个 数组 
(10 个 数据 项 ) 的 内 容 ， 然 后 将 相 加 结果 存 和 人 另 一 个 数组 〈 也 是 10 个 数据 项 ) ， 最 后 打印 输出 结果 。 


#include <stdio.h> 
#define NUM STUDENTS 10 


int main() 

{ 
int i; 
int Exam1[NUM STUDENTS]; 
int Exam2 [NUM STUDENTS]; 
int Total[NUM STUDENTS]; 


/* input Exam 1 scores */ 
for (i = 0; i < NUM STUDENTS; i++) ( 


printf("Input Exam 1 score for student $d : ", i); 
scanf("*d", &Examl[i]); 


} 


printf ("\n"); 


/* Input Exam 2 scores */ 

for (i = 0; i < NUM STUDENTS; i++) { 
printf ("Input Exam 2 score for student $d : ", i); 
scanf ("%d", &Exam2[i]); 


printf ("Mn"); 





图 16-8 计算 两 个 10 元 素数 组 相 加 的 程序 
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/* Calculate Total Points */ 
for (i = 0; i < NUM STUDENTS; i++) ( 
Totalfi] = Examl [i] + Exam2[i]; 


/* Output the Total Points */ 
for (i = 0; i < NUM STUDENTS; i++) { 
printf("Total for Student $d = $dWMn", i, Totallil); 


} 





图 16-8 计算 两 个 10 元 素数 组 相 加 的 程序 (R) 


其 中 ， 有 关 编 程 风 格 上 的 建议 是 ， 注 意 其 中 预 处 理 宏 NUM_STUDENTS 的 使 用 ， 它 是 代表 输入 
集合 大 小 的 一 个 常数 。 这 是 一 种 常见 的 预 处 理 宏 用 法 ,我 们 常 在 C 的 源 文件 (或 头 文件 ) 开始 几 行 中 ， 
看 到 类 似 的 定义 。 假 设 ， 现 在 我 们 要 增 大 数组 的 大 小 (比如 注册 学 生 数 目 发 生变 化 )， 我 们 所 要 做 的 
事情 ， 只 是 修改 这 个 宏 定 义 ( 只 有 一 处 )， 然 后 重新 编译 程序 即 可 。 如 果 没 有 使 用 宏 ， 则 改变 数组 大 
小 这 样 一 件 事 ， 意 味 着 在 代码 的 各 个 数组 使 用 处 都 要 做 出 修改 。 并 且 ， 稍 有 醉 包 ， 遗 漏 某 个 修改 点 ， 
程序 就 无 法 正常 工作 。 所 以 ， 此 处 采用 预 处 理 宏 来 定义 数组 的 大 小 ， 又 是 一 个 好 的 编程 习惯 。 

下 面 我 们 看 一 个 更 复杂 的 数组 例子 。 如 图 16-9 所 示 ， 程 序 从 键盘 连续 读 人 一 组 十 进 制 数 〈 总 共有 
MAX_NUMS 个 ) ， 然后 统计 每 个 数字 在 序列 中 出 现 的 次 数 ， 最 后 ， 打 印 每 个 数字 及 其 重复 出 现 次 数 。 


#include <stdio.h> 
#define MAX_NUMS 10 


int main() 


{ 


int index; /* Loop iteration variable 
int repIndex; /* Loop variable for rep loop 
int numbers [MAX NUMS]; /* Original input numbers 

int repeats[MAX NUMS];  /* Number of repeats 


OO -1 0 01 4 Q0 T0 2 


/* Get input */ 

printf ("Enter $d numbers.Vn", MAX NUMS); 

for (index = 0; index < MAX NUMS; index++) { 
printf ("Input number td : ", index); 
scanf ("%d", &numbers[index]); 


} 


/* Scan through entire array, counting number of 
/* repeats per element within the original array 
for (index = 0; index < MAX NUMS; index++) ( 
repeats[index] = 0; 
for (repIndex = 0; repIndex < MAX NUMS; repIndex««) { 
if (numbers[repIndex] == numbers [index]) 
repeats [index] ++; 


} 
) 


/* Print the results */ 
for (index = 0; index < MAX NUMS; index**) 
printf("Original number $d. Number of repeats $dWn", 
numbers [index] , repeats[index]); 





图 16-9 统计 数组 里 每 个 数值 重复 次 数 的 C 程 序 


该 程序 使 用 了 numbers 和 repeats 两 个 数组 (都 是 MAX_NUMS 个 整数 项 )。 其 中 ，numbers 代 表 
输入 数字 序列 ，repeats 代 表 各 数字 在 numbers 中 重复 出 现 的 次 数 。 例 如 ， 如 果 numbers[3] = 115， 而 
在 整个 输入 序列 中 ， 曾 4 次 输入 “115”( 即 在 数组 numbers 中 有 4 个 115) ， 则 repeats[3] 等 于 4。 

程序 中 包含 三 个 大 循环 体 。 第 一 个 和 最 后 一 个 for 循 环比 较 简 单 ， 分 别处 理 键盘 输入 和 打印 输 
出 。 中 间 的 循环 体 是 一 个 装 宕 循环 ( 见 13.3.2 节 )， 实 际 上 包含 了 两 层 人 循环 。 
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中 间 的 for 傣 套 循 环 负责 统计 每 个 元 素 在 全 数组 中 出 现 的 次 数 。 其 中 ， 外 层 循 环 的 计数 变量 
index 依 次 从 0~MAX_NUMS ， 即 通过 index 扫 摘 整 个 数组 ， 从 第 1 个 元 素 numbers[0] 到 最 后 一 个 元 素 
numbers|«MAX NUMS]; 内 层 循环 的 计数 范围 也 是 0~MAX_NUMS， 该 层 循 环 的 任务 也 是 再 次 扫 搞 
整个 数组 ， 统 计 的 是 在 数组 中 存在 多 少 个 元 素 ， 其 值 与 外 层 循 环 当 前 选中 的 元 素 (numbersfindex] ) 
相同 。 每 匹配 到 一 个 相同 值 ( 即 numbersJrepIndex] == numbers[index]), ， 则 repeats 中 对 应 项 的 值 就 
加 1 ( 即 repeats[index]++) 。 


16.3.3 数组 参数 


在 函数 之 间 传 递 数组 也 非常 有 用 ， 因 为 它 将 使 得 函数 具备 运算 数组 的 能 力 。 假 设 ， 我 们 要 编 
写 一 组 函数 ， 分 别 求 解 整 型 数组 的 平均 值 和 中 间 值 ， 则 我 们 可 以 : (1) 传递 数组 值 ， (2) 传递 该 
数组 的 地 址 。 如 果 该 数组 的 数据 项 数目 很 大 ， 则 将 该 数组 从 一 个 活动 记录 区 拷贝 到 另 一 个 活动 记 
录 区 是 件 非 常 耗 时 的 操作 。 所 幸 的 是 ，C 语 言传 递 数组 时 ， 天 生 采 用 的 就 是 “ 传 址 ”方式 。 如 图 
16-10 所 示 ， 沙 数 Average 需 要 的 是 一 个 数组 参数 (整数 类 型 ) 。 


#include «stdio.h» 
#define MAX_NUMS 10 








int Average(int input values[]); 






int main() 
{ 
int index; 
9 int mean; 
int numbers[MAX NUMS]; 






/* Loop iteration variable  */ 
/* Average of numbers */ 
/* Original input numbers */ 















/* Get input */ 







14 printf("Enter %d numbers.\n", MAX NUMS); 

15 for (index = 0; index < MAX NUMS; index++) ( 
16 printf("Input number $d : ", index); 

17 scanf("*d", &numbers [index]); 


) 


mean - Average (numbers); 













printf("The average of these numbers is $d\n", mean); 





} 


int Average(int inputValues[]) 
26 { 

27 int index; 
int gum = 0; 







for (index = 0; index < MAX NUMS; index++) { 
31 sum = sum + inputValues [index] ; 


) 


return (sum / MAX NUMS); 






图 16-10 参数 为 数组 的 函数 的 例子 


其 中 ，main 函 数 在 调用 Average 时 ， 我 们 要 把 和 数组 标识 符 nambers 相 关 的 值 传 给 它 。 注 意 ， 我 们 
这 里 没有 像 正常 使 用 数组 那样 用 方 插 号。 在 C 语 言 里 ， 数 组 的 名 字 引 用 数组 首 元 素 的 地 址 。 也 就 是 说 ， 
名 字 numbers 等 于 &numbersf0]。numbers 的 类 型 和 int * 很 像 ， 它 是 一 个 包含 了 整数 的 内 存 空间 的 地 址 。 

numbers 作 为 函数 Average 的 参数 ， 在 调用 时 numbers 的 地 址 被 压 人 Average 的 栈 。 而 在 函数 
Average 中 ， 将 该 数组 地 址 赋 给 变量 inputValues， 并 用 标准 的 数组 符号 方式 访问 原始 数组 元 素 。 图 
16-11 所 示 是 Average 在 return 语 名 (第 34 行 语句 ) 执行 之 前 的 运行 时 楼 快照 。 
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numbers [2] 
numbers [3] 
numbers [4] 
numbers [5] main ARMED 
numbers [6] 
numbers [7} 
numbers [8] 


numbers [9] 





图 16-11 函数 Average 返回 前 的 栈 空间 内 容 
注意 ， 其 中 输入 参数 inputValues 在 函数 Average 中 的 声明 方法 。 方 括号 [] 意 味 着 ， 告 诉 编译 器 
该 参数 是 某 数组 的 基地 址 。 
由 于 在 C 语 言 中 ， 数 组 采用 “ 传 址 ”方式 。 所 以 ， 在 被 调用 函数 内 ， 对 数组 值 所 做 的 任何 修改 ， 
在 控制 权 返 回调 用 者 之 后 都 是 可 见 的 。 再 思考 一 个 问题 ， 如 果 我 们 所 要 传递 的 参数 是 某 个 数据 项 
(而 不 是 整个 数组 ) ， 又 该 怎样 选择 是 “ 传 值 ”方式 还 是 “ 传 址 ”方式 呢 ? 


16.3.4 “C 语 言 的 字符 串 


在 C 语 言 中 ,字符 串 是 数组 的 一 个 重要 应 用 。 所 谓 “ 字 符 串 "， 是 表示 文本 (text) 的 字符 序列 ， 
本 质 上 它 就 是 字符 数组 。 例 如 ， 


char word[10]; 

该 语句 声明 的 是 一 个 可 以 储存 10 个 字符 的 数组 。 字 符 串 越 长 ， 所 需要 的 数组 长 度 越 大 。 如 果 该 
字符 串 长 度 小 于 10， 会 怎样 ?在 C 等 现代 编程 语言 中 ， 字 符 串 结 尾 处 是 一 个 空 字符 (其 ASCII 码 值 为 
0) ， 它 代表 字符 串 的 结束 ， 这 样 的 字符 串 也 称 为 无 传输 字符 串 。 空 字符 在 代码 中 表示 为 V。 下 面 继 


续 之 前 的 声明 : 


char word[10]; 


word[0] = 'H'; 
word[1] = 'e'; 
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word [2] 
word [3] 
word [4] 
word [5] 
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printf("*$s", word); 


在 此 ， 我 们 一 个 一 个 地 给 数组 的 每 个 元 素 赋值 。 结 果 是 数组 的 内 容 包 含 字符 串 “Hello"。 注意， 
字符 串 的 结束 符 本 身 也 是 一 个 字符 ， 它 在 数组 中 也 占有 一 个 位 置 。 所 以 ， 尽 管 数组 的 声明 长 度 为 
10， 由 于 为 空 字符 保留 了 一 个 位 置 ， 所 以 该 数组 能 存放 的 字符 串 长 度 最 大 为 9。 

在 这 个 例子 中 ，printf 使 用 了 一 个 新 的 格式 规范 “%s”。 该 格式 规范 的 作用 是 ， 打 印字 符 串 中 
的 所 有 字符 。 从 参数 指定 地 址 开始 ， 直 到 结束 字符 NO. 为止。 

ANSIC 编 译 器 克 许 字符 串 在 声明 时 被 初始 化 。 例 如 ， 前 面 例子 可 以 表示 如 下 ; 

char word[10] - "Hello"; 

printf("$s", word); 

值得 注意 的 是 : (1) 字符 串 和 单个 字符 有 所 区 别 。 在 代码 中 ， 字 符 串 由 双 引 号 “” 包 围 ， 而 
单字 符 则 由 单 引 号 包围 (An 'A') ; (2) 编译 器 会 自动 在 字符 串 结 尾 添加 结束 符 ND. 

字 罕 囊 的 例子 

如 图 16-12 所 示 的 代码 中 ， 包 含 的 是 一 个 有 关 字 符 串 的 简单 但 却 非 常 有 用 的 操作 : 计算 字符 串 
的 长 度 。 我 们 知道 ， 字 符 数 组 的 大 小 并 不 代表 它 所 包含 字符 串 的 长 度 〈 它 只 能 代表 字符 串 的 最 大 
长 度 ) 。 所 以 ， 我 们 需要 通过 检查 结束 符 ， 才 能 判断 该 字符 串 的 实际 长 度 。 


#include «stdio.h» 
#define MAX STRING 20 


int StringLength (char string[]); 
int main() 


char input[MAX STRING]; /* Input string */ 
int length = 0; 


printf("Input a word (less than 20 characters): "); 
Scanf("$s", input); ， 


length = StringLength (input) ; 
printf("The word contains $d charactersWn", length); 


int StringLength(char string[]) 
int index = O0; 


while (string[index] !- 'X0') 
index = index + 1; 


return index; 
图 16-12 计算 字符 串 长 度 的 程序 


判断 字符 串 长 度 的 算法 很 简单 。 从 字符 串 的 第 一 个 元 素 开始 ， 直 到 遇 到 结束 字符 为 止 ， 所 经 
过 的 字符 数目 就 是 字符 串 的 长 度 。 图 16-12 所 示 的 StringLength 函 数 就 是 这 么 做 的 。 

注意 ， 其 中 scanf 语 句 所 使 用 的 格式 规范 “%s” ， 它 代表 scanf 将 从 键盘 读 人 一 连 串 字符 ， 直 到 
过 到 第 一 个 空 (white space) 字符 。 在 C 语 言 中 ， 空 字符 包括 : TH., MA (tab), HiT. E 
车 、 垂 直 制 表 符 (vertical tab) 或 填 表 (form-feed) 符 等 。 所 以 ， 如 果 程 序 运 行 时 ， 用 户 输入 下 面 
这 段 话 (摘自 《The New Colossus》 作 者 为 Emma Lazarus); 


Not like the brazen giant of Greek fame, 
With conquering limbs astride from land to land; 
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结果 是 ， 只 有 单词 Not 被 存 人 数组 input， 余 下 的 内 容 则 要 等 待 后 面 的 scanf 调 用 来 读 取 。 所 以 ， 
如 果 我 们 再 一 次 “scanf(*9%s”, &input);”， 则 input 中 存 人 “like”。 注 意 ， 之 间 的 空 字符 被 “9%s” 控 


制 符 忽 略 。 参 考 第 18 章 的 1/O 行 为 描述 。 

注意 ， 宏 定义 规定 了 字符 数组 的 最 大 长 度 是 20。 那 么 ， 如 果 第 一 个 有 效 单词 的 长 度 大 于 20， 
将 发 生 什 么 情况 ?由 于 scanf 函 数 并 未 指定 有 关 input 数 组 大 小 的 信息 ， 所 以 它 将 不 断 地 把 输入 字符 
依次 填 入 指定 数组 (或 地 址 )， 直 到 遇 到 空 字符 为 止 。 如 果 第 一 个 单词 的 长 度 大 于 20， 则 在 main 函 
数 内 ，、input 之 后 的 局 部 变量 空间 将 被 覆盖 。 只 要 画 出 scanf 在 调用 前 后 活动 记录 的 快照 ， 就 可 以 知 
道 其 原因 了 。 在 本 章 习 题 中 有 一 个 题目 ， 基 要 求 就 是 让 你 修改 该 程序 ， 捕 提 用 户 输入 字符 数 大 于 
input 数 组 长 度 的 情况 。 

下 面 是 一 个 稍微 复杂 的 例子 ， 用 到 了 前 面 的 StringLength 函 数 。 如 图 16-13 所 示 代 码 ， 我 们 使 用 
scan ABER IRA ERE RR 然后 调用 一 个 函数 “ 反 转 ”该 字符 串 ， 然 后 输出 反 转 后 的 字符 串 (所 谓 

反 转 " ， 是 指 如 果 原 字符 串 为 “Hello”， 则 反 转 后 结果 为 “olleH”。) 


dinclude <stdio.h> 
#define MAX STRING 20 





int StringLength (char string[]); 
void CharSwap(char *firstVal, char *secondVal); 
void Reverse (char string[l); 


int mainí) 






o0 -0UuU Uu tmb! 


char input[MAX STRING]; /* Input string */ 















printf("Input a word (less than 20 characters): "); 


scanf ("$s", input); 





Reverse (input); 
16 printf("The word reversed is %s.\n", input); 


) 


int StringLength(char string[]) 










int index - 0; 





'AQ!) 








while (string[index] !- 
index = index + 1; 










return index; 





) 


void CharSwap(char *firstVal, 





char *secondVal) 






char tempVal; /* Temporary location for swapping */ 









tempVal - *firstVal; 
34 *firstVal - *secondVal; 
35 *secondVal - tempVal; 


) 


void Reverse(char stringíl) 
39 { 

40 int index; 
int length; 











length = StringLength (string); 





index < (length / 2); index++) 
&string[length - (index « 1)]); 





for (index - 0; 
CharSwap(&string[index]l, 









图 16-13 反 转 字符 串 的 程序 
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其 中 ， 反 转 函 数 Reverse 要 完成 两 个 任务 ， 一 是 借用 StringLength 函 数 获取 字符 串 长 度 ， 二 是 交 
换 字符 ， 第 1 个 与 最 后 一 个 交换 ， 第 2 个 与 倒数 第 二 个 交换 ， 以 此 类 推 。 

为 完成 交换 ， 我 们 修改 了 如 图 16-4 所 示 的 NewSwap 函 数 。 在 Reverse 函 数 的 反 转 循环 中 ， 我 们 
循环 调用 CharSwap 函 数 ， 以 交换 字符 串 中 两 个 字符 的 位 置 。 

在 C 标 准 函 数 库 中 ， 提 供 了 许多 优秀 的 字符 串 操 作 函 数 。 例 如 ， 字 符 串 拷贝 、 字 符 串 合并 、 字 
符 捉 比较 、 字 符 串 长 度 计 算 等 函数 。 这 些 函 数 的 声明 ， 都 包含 在 头 文件 <string.h> 中 。 可 参考 附录 
D.9.2 中 有 关 字 符 串 的 各 种 操作 函数 。 


16.3.5 数组 与 指针 的 关系 


或 许 你 已 经 注意 到 ， 数 组 与 指针 存在 一 定 的 共性 。 例 如 ， 数 组 的 名 字 与 指向 数组 的 指针 变量 
是 等 价 的 ， 如 下 面 代 码 所 示 : 


char word[10]; 
char *cptr; 


cptr = word; 


该 代码 完全 合法 ,并 且 非 常 有 用 。 在 此 ,我 们 赋值 指针 变量 cptr， 使 之 等 于 数组 word 的 基地 址 。 
两 者 都 是 指向 字符 的 指针 ， 所 以 cptr 和 word 之 间 可 以 互 换 。 例 如 ，word[3] 和 *(cptr + 3)， 访 问 的 都 
是 字符 串 中 的 第 4 个 字符 。 

_ 两 者 之 间 的 不 同 之 处 是 ，cptr 是 可 被 赋值 的 变量 ， 而 数组 标识 符 word 不 可 被 赋值 。 例 如 ， 语 句 
"word = newArray” 就 是 不 合法 的 。 对 编译 器 来 说 ， 数 组 标识 符 一 定 是 指向 数组 在 内 存 的 地 址 ， 所 
以 一 旦 分 配 该 标识 符 ， 就 “不 应 该 ”再 被 修改 了 。 

表 16-1 所 示 是 指针 与 数组 符号 之 间 的 等 价 表 达 式 。 同 一 行 中 的 表达 式 都 是 相互 等 价 的 。 


表 16-1 指针 与 数组 之 间 的 关系 


cptr word &word[0] 
(cptr + n) word + n &word[n] 
*cptr *word word(0] 
*(cptr4n) *(word + n) wordin] 


16.3.6 3cBj. 插入 排序 


在 学 习 了 数组 之 后 ， 我 们 准备 借用 它 来 解决 一 个 “难题 "， 这 是 一 个 非常 有 意思 且 非 常 有 用 的 
问题 : 将 一 个 整 型 数组 内 的 所 有 元 素 ， 按 照 升 序 排列 。 换 名 话说 ， 就 是 重新 整理 数组 (aD), (Bd 
新 数组 满足 : a[0] «a[1]«a[2]--. 

为 完成 该 任务 ， 我 们 将 采用 一 种 被 称 做 “插入 排序 ”(Insertion Sort). 的 算法 。 所 谓 “ 排 序 ” 
(sorting) ， 是 计算 科学 中 的 一 个 经 典 问 题 ， 人 们 已 花费 很 长 时 间 去 理解 、 分 析 和 优化 排序 问题 。 所 
以 ， 现 在 存在 很 多 排序 算法 ， 在 后 续 的 计算 机 课程 中 ， 你 将 学 习 它 们 。 我 们 在 此 采用 “插入 排序 ” 
算法 ， 是 因为 它 与 生 话 中 常用 的 排序 方法 接近 ， 因 而 更 容易 理解 。 

我 们 以 如 下 例子 讲解 插 人 和 人 排序。 假设 你 在 整理 所 收藏 的 音乐 CD 盒 ， 并 根据 CD 的 艺术 家 名 字 的 
字母 顺序 ， 有 序 排 放 这 些 CD。 假 定 采 用 “ 插 和 人 排序” 法。 首先 ， 将 CD 分 为 两 堆 ， 一 堆 是 已 整理 
(HEF) 的 ， 一 堆 是 还 未 排序 的 。 当 然 ， 一 开始 “已 排序 堆 ” 必 然 是 空 的 。 然 后 ， 开 始 排序 。 每 从 
未 排序 堆 抽取 一 张 CD， 则 将 它 按 序 插入 已 排序 堆 。 例 如 ， 假 设 已 排序 堆 中 现 有 三 张 CD， 艺 术 家 的 
名 字 分 别 是 : Coltrane、Mingus 和 Monk。 现 在 有 一 张 Davis 的 CD ， 则 应 该 将 它 放 在 Coltrane 和 
Mingus 之 间 。 随 后 ， 依 次 排放 ， 直 到 未 排序 堆 为 空 ， 我 们 称 这 种 方法 为 “插入 排序 ”。 
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那么 ， 我 们 应 该 怎样 将 这 种 方法 应 用 在 数组 排序 中 呢 ? 采用 系统 分 解法 分 析 刚 才 的 算 东 ， 我 
们 发 现 ， 程 序 的 核心 应 该 是 一 个 对 数组 的 循环 操作 ， 将 数组 中 的 每 个 元 素 ， 按 序 播 人 新 数组 中 。 
最 后 ， 新 数组 与 原 数组 的 元 素 应 该 是 一 样 的 ， 只 是 硕 序 不 同 而 已 。 

所 以 ， 在 该 算法 的 代码 实现 中 ， 我 们 需要 两 个 数组 ， 一 个 是 原 数 组 ， 另 一 个 是 已 排序 数组 。 
EK, 我 们 可 以 只 使 用 一 个 数组 ， 就 能 完成 这 个 任务 ， 这 将 使 代码 的 内 存 占 用 量 大 大 减 小 (只 是 
对 初学 者 来 说 ， 有 些 费 解 而 已 )。 采 用 单个 数组 的 方法 是 ， 数 组 起 始 部 分 为 已 排序 元 素 ， 剩 余部 分 
为 未 排序 元 素 。 每 从 未 排序 部 分 GERD) 取出 一 个 元 素 ， 则 将 它 插入 排序 部 分 的 正确 位 置 (数组 
插入 意味 着 可 能 存在 大 量 元 素 的 移动 ) 。 如 此 反复 ， 直 到 数组 全 部 被 遍历 。 

图 16-14 所 示 是 真正 的 插入 排序 程序 InsertionSort， 它 使 用 了 一 个 艇 套 循环 。 外 层 循环 负责 轮流 
扫描 所 有 未 排序 项 ， 内 层 循 环 扫 描 的 是 已 排序 项 (为 新 元 素 查找 插入 位 置 )。 
















1 #include <stdio.h> 

2 #define MAX NUMS 10 

3 

4 void InsertionSort(int list[]); 

5 

6 int main() 

7 

B int index; /* Iteration variabie */ 
9 int numbers[MAX NUMS]; /* List of numbers to be sorted */ 
10 : 

11 /* Get input */ 
12 printf ("Enter td numbers. An", MAX NUMS); 

13 for (index = 0; index < MAX NUMS; index««) (. 
14 printf ("Input number $&d : ", index); 

15 scanf ("%d", &numbers [index]); 





) 


InsertionSort (numbers); 









/* Call sorting routine 







/* Print sorted list */ 







21 printf("NnThe input set, in ascending order: Wn"); 
22 for (index = 0; index < MAX NUMS; Index++) 
23 printf("$dMn", numbers [index] ); 






} 


void InsertionSort (int listí]) 
27 { 

28 int unsorted; /* Index for unsorted list items */ 
29 int sorted; /* Index for sorted items x*/ 
int unsortedItem; /* Current item to be sorted 




















/* This loop iterates from 1 thru MAX NUMS */ 
33 for (unsorted = 1; unsorted < MAX NUMS; unsorted««) ( 
unsortedItem - list[unsorted]; 








/* This loop iterates from unsorted thru 0, unless 
37 we hit an element smaller than current item */ 








38 for (sorted = unsorted - 1; 
39 (sorted »- 0) && (list[sorted] » unsortedItem); 
40 sorted--) 






list[sorted + 1] = list[sorted]; 










list[sorted + 1] = unsortedItem; /* Insert item */ 







} 
} 





图 16-14 插入 排序 


下 面 我 们 详解 一 下 插入 排序 的 过 程 。 假 设 ， 变 量 unsorted = 4 时 (第 33~43 行 )，list 数 组 包含 的 
10 个 元 素 如 下 所 示 : 
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2 16 69 92 15 37 92 38 82 19 

之 后 要 做 的 ， 是 将 list[4] ( 即 15) 插入 到 ]ist[0] 到 list[3] 之 间 的 已 排序 堆 中 。 . 

内 层 循 环 的 计数 变量 是 sorted， 以 此 遍历 list 中 已 排序 元 素 (list[0]~list[3])。 注 意 该 for 循 环 的 
条 件 ， 如 果 1list 中 某 项 小 于 当前 要 揪 入 值 (15) ， 则 位 置 就 找到 了 。 

内 层 循 环 体 (第 38~41 行 ) 每 执行 一 次 ， 就 将 已 排序 部 分 的 一 个 元 素 移 动 到 它 的 下 一 个 位 置 。 
例如 ，list[3] 被 拷贝 到 list[4]。 所 以 ， 内 层 循环 体 第 一 次 执行 之 后 ， 数 组 list 的 内 容 如 下 所 示 : 

2 16 69 92 92 37 92 38 82 19 

注意 ，15 原 来 的 位 置 (list[4]) 被 覆盖 了 。 不 用 担心 ， 我 们 已 将 15 备 份 在 unsortedItem 变 量 中 “ 
了 。 第 二 次 循环 ， 则 对 list[2] 做 同样 的 操作 。 所 以 ， 第 二 次 循环 之 后 ，list 的 内 容 变 为 ， 

2 16 69 69 92 37 9%2 38 82 19 

第 三 次 之 后 ，list 为 

2 16 16 69 92 37 92 38 82 19 

至 此 ，for 循 环 中 止 ， 因 为 条 件 不 再 为 “ 真 ”( 即 条 件 list[sorted] > unsortedItem 不 再 满足 )。 因 
为 当前 已 排序 项 list[0]=2， 它 比 unsortedItem (15) 小 。 内 旦 循环 中 止 后 ， 执 行 语句 “list[sorted + 
1] = unsortedItem;”。 于 是 ，list 已 排序 部 分 多 了 一 个 元 素 : 

2 15 16 69 92 37 92 38 82 19 


通过 这 种 操作 ， 我 们 可 以 将 整个 数组 都 做 排序 ， 即 外 层 循环 遍历 整个 list 数 组 。 
16.3.7 C 语 言 数 组 的 不 足 


与 其 他 现代 编程 语言 相 比 ，C 语 言 未 提供 数组 的 越界 保护 。 所 以 ， 这 成 为 C 编 程 中 出 错 的 一 个 
常见 原因 。 换 名 话说 ，C 语 言 对 一 个 数组 索引 ， 未 判断 它 是 否 落 在 数组 范围 内 。 编 译 器 对 于 表达 式 
at 的 处 理 是 ， 只 生成 计算 索引 表达 式 i 的 代码 ， 而 不 去 (其实 是 无 法 ) 判断 它 是 否 可 能 超越 最 后 一 
个 数组 元 素 。 如 图 16-15 所 示 的 代码 ， 说 明了 这 种 数组 越界 问题 导致 的 严重 后 果 。 如 果 为 limit 输 入 
一 个 大 于 数组 长 度 (MAX SIZE) 的 数字 ， 该 程序 将 表现 出 各 种 可 能 的 怪 现象 9。 


#include <stdio.h> 
#define MAX SIZE 10 


int main() 
int index; 
int array[MAX SIZE]; 
int limit; 


printf("Enter limit (integer): "); 
scanf ("%d", &limit); 


for (index = 0; index < limit; index++) { 
array[index] = 0; 
printf(*array[td] is set to OWMn", index); 





图 16-15 如 果 用 户 输入 一 个 太 大 的 数 ， 这 个 程序 会 发 生 一 些 怪 现象 


你 可 以 通过 程序 运行 时 栈 的 绘制 ， 分 析出 现 问 题 的 原因 。 
但 正 是 C 语 言 不 对 数组 做 边界 检查 ( 较 弱 的 数组 访问 限制 )， 才 使 得 C 代 码 的 执行 速度 更 快 。 这 


日 ”由 所 使 用 的 编译 嚣 决定。 为 了 可 以 观察 到 这 个 问题 ， 你 需要 输入 一 个 大 于 16 的 数 ， 或 者 在 array 之 后 声 
表 index。 
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是 C 语 言 的 特性 之 一 ， 与 其 他 语言 相 比 ， 它 赋予 了 程序 员 更 多 的 控制 能 力 。 所 以 ， 如 果 你 在 编码 时 
不 够 细心 ， 这 个 “bare-bones philosophy”( 露 骨 哲 学 ) (C 语 言 的 设计 哲学 是 ， 将 所 有 控制 权 交 给 
EFA) 将 让 你 饱 党 调试 艰辛 。 为 了 避免 这 类 问题 ， 有 经 验 的 C 程 序 员 在 使 用 数组 时 ， 通 常会 设计 
一 些 编程 技巧 。 

C 语 言 的 数组 存在 的 另 一 个 缺陷 是 ， 数 组 大 小 是 固定 的 〈 特 别 是 静态 声明 的 数组 ) 。 换 名 话说 ， 
编译 该 程序 时 ， 就 必须 确认 数组 的 大 小 。C 语 言 不 支持 用 变量 方式 声明 数组 的 大 小 。 例 如 ， 如 下 C 
代码 是 不 合法 的 。 因 为 编译 器 要 求 ， 数 组 temp 的 大 小 (num_elements) 在 源 代码 分 析 时 刻 ， 必 须 
是 已 确定 的 数值 。 

void SomeFunctioní(int num elements) 


int temp[num elements];  /* Generates a syntax error */ 


} 

对 于 有 经 验 的 C 程 序 员 ， 面 对 这 个 问题 时 的 处 理 办 法 通常 是 ， 仔细 分 析 代 码 的 使 用 场合 ， 然 后 
分 配 “ 足 够 大 ”的 空间 。 此 外 ， 还 可 以 辅助 添加 自己 设计 的 边界 检查 代码 ， 以 确认 数组 大 小 是 否 
是 “足够 大 "。 另 一 个 可 选 方案 是 ， 使 用 动态 内 存 分 配方 法 ， 即 在 运行 时 分 配 数 组 空间 (有 关内 容 
将 在 第 19 章 介绍 )。 


16.4 小结 


本 章 讲述 的 重点 是 指针 和 数组 这 两 个 高 级 编程 结构 。 这 两 个 结构 的 特点 是 ， 都 可 以 间接 访问 
内 存 。 本 章 的 关键 内 容 总 结 如 下 : i 
。 指针 。 所 谓 “ 指 针 ”， 是 一 个 包含 其 他 内 存 对 象 (如 变量 ) 地 址 的 变量 。 通 过 指针 ， 我 们 可 
以 间接 存 取 和 操作 这 些 内 存 对 象 。 指 针 的 一 个 简单 应 用 是 ， 它 可 以 在 函数 调用 时 ， 通 过 “ 传 
址 ”方式 传递 参数 。 指 针 的 应 用 还 有 很 多 ， 我 们 将 在 后 续 章节 看 到 它们 。 
。 数组。 所 谓 “数组 ”， 是 一 组 同类 型 元 素 在 内 存 中 的 连续 排列 。 我 们 通过 “索引 ”访问 数 
组 中 的 特定 元 素 。 “索引 ”等 于 该 元 素 距 离 数组 起 始 位 置 的 偏 移 量 。 很 多 生活 中 的 对 象 ， 
在 计算 机 程序 中 很 适合 于 表示 为 数组 ， 这 使 得 数组 成 为 一 个 非常 重要 的 数据 结构 。 例 如 ， 
字符 串 就 是 一 个 文本 内 容 的 数组 。 此 外 ， 我 们 还 学 习 了 几 种 数组 操作 方法 (包括 “插入 排 
FF" d). 
165 习题 


161. i58 5— CHE. LL— TER IBS. CES BR—THHEBTOEBUÓB SI. MRES E 
将 英语 单词 翻译 成 “Pig Latin”。 翻 译 规则 是 : 将 单词 字符 串 的 首 字母 移 到 最 后 ， 然 后 添加 
字母 “ay”。 你 可 以 假设 这 个 数组 的 长 度 足 够 包含 这 两 个 额外 字母 。 
例如 ， 如 果 和 参数 为 单词 “Hello” ， 则 转换 结果 为 “elloHay”。 

16.2 试 编写 C 程 序 ， 它 将 不 停 地 接受 用 户 输 入 的 数字 ， 直 到 最 后 两 个 数字 完全 相同 为 止 ， 然 后 打 
印 输出 已 接收 数字 的 个 数 (不 包括 最 后 一 个 )， 以 及 这 些 数 字 的 累加 和 。 程 序 提示 和 输出 界 
面 如 下 所 示 : 


4 numbers were entered and their sum is 44 


16.3 试问 ， 如 下 代码 编译 后 的 执行 结果 如 何 ? 
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16.4 


16.6 


16.8 


16.9 


16.10 


int x; 
int main() 


int *px = &X; 
int x = 7; 


*px = 4; 
printf("x = $&dWMn", x); 


} 
试 编写 一 个 字符 串 操 作 函 数 ， 输 入 参数 为 两 个 字符 串 stringA 和 stringB。 如 果 两 个 字符 串 相 
同 ， 则 返回 0， 按 字典 顺序 ， 如 果 stringA 排 在 stringB 之 前 ， 则 返回 1， 如 果 stringB 排 在 
stringA 之 前 ， 则 返回 2。 
基于 习题 16.4 的 函数 ， 修 改 “ 插 和 排序” 程序， 使 它 能 够 对 字符 串 (而 不 是 整数 ) 进行 排 
序 。 
试 将 如 下 C 函 数 翻 译 为 LC-3 汇 编 代 码 。 
int main() 

int a[5], i; 

i = 4; 

while (i >= 0) { 

TRE 

) ! | 
分 析 如 下 程序 ， 回 答 问 题 。 注 意 ，ind 是 指向 指针 变量 的 指针 变量 (这 种 结构 在 C 语 言 里 是 合 
法 的 )。 
#include «stdio.h» 


int main() 


int apple; 

int *ptr; 

int **ind; 

ind - &ptr; 
*ind = &apple; 
**ind = 123; 


indes; 
*ptreés; 
apples*; 


printf("$x $x d\n", ind, ptr, apple); 


] 

画 出 “apple++;” 语 名 执 行 之 后 ， 运 行 时 栈 的 快照 。 然 后 分 析 该 程序 的 行为 。 
如 下 代码 调用 了 函数 triple。 试 问 ，triple 函 数 的 活动 记录 空间 应 不 小 于 多 大 ? 
int main() 


int array[3]; 


array [0] 1; 
array[1] - 2; 
array[2] = 3; 


triple (array); 


) 

试 编写 程序 ， 删 掉 数 字 序 列 中 的 重复 数据 项 。 例 如 ， 如 果 数 字 内 容 为 “5，4，5，5,，3 ， 则 
程序 输出 结果 为 “5，4，3 。 

试 编写 程序 ， 找 出 一 个 数字 集合 的 中 值 (median) 。 所 谓 “ 中 值 ”， 是 指 集合 中 一 半 的 数 比 
它 小 ， 另 一 半 的 数 比 它 大 。 提 示 : 先 对 该 集合 排序 。 
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16.11 


16.12 


16.13 


阅读 以 下 C 程 序 ， 回 答 问题 。 
int FindLen (char *); 
int main() 

char str[10]; 

printf ("Enter a string : "); 


scanf ("%s", str); 
printfí("$s has $d characters\n", str, FindLen(str)); 


) 

int FindLen(char * s) 
int len-0; 
while (*s !- 'No') { 


lens; 
Stt; 


} 


return len; 


] 

a. main pÁ Zi fi FindLeneR 2 B 18 3 i 4 9029 & X? 

b. 如 果 FindLen 的 输入 参数 是 字符 串 “apple”， 试 写 出 FindLen 返 回 前 运行 时 栈 的 内 容 。 

c. 如 果 程 序 运行 时 ， 用 户 输入 的 字符 串 长 度 大 于 10， 那 么 这 个 活动 记录 内 容 如 何 ? 

如 下 代码 的 任务 是 : 从 键盘 读 入 一 个 字符 串 ， 然 后 将 其 中 的 大 写字 符 转换 为 小 写字 符 ， 最 
后 输出 转换 后 的 字符 串 。 但 是 ， 该 程序 存在 错误 ， 请 指出 。 


#include <stdio.h> 
#define MAX_LEN 10 
char *LowerCase(char *s}; 


int main() 
char str[MAX LEN]; 


printf("Enter a string : "); 
scanf ("%s", str); 


printf("Lowercase: $s Mn", LowerCase(str)); 


char *LowerCase(char *s) ( 
char newStr[MAX LEN]; 
int index; 


for (index = 0; index < MAX LEN; index««) { 
if ('A' «- s[index] && s[index] <= 'Z') 


newStr[index] = s[index] + ('a' - 'A'); 
else 
newStr[index] = s[index]; 


) 


return newStr; 


} 
阅读 如 下 声明 语句 ， 回 答 问题 。 
#define STACK SIZE 100 


int Stack[STACK SIZE]; 
int topOfStack; 


int Push(int item); 


a. 编写 函数 Push (已 声明 )， 将 参数 值 item 压 入 栈 (stack 数 组 ) 顶部 。 如 果 栈 已 满 ， 则 不 能 
压 入 ， 同 时 函数 返回 1， 如 果 item 压 人 成功， 则 函数 返回 0。 

b. 编写 函数 Pop ， 弹 出 栈 顶 元 素 。 类 似 于 Push， 如 果 操 作 失 败 ( 即 尝试 从 空 栈 弹 出 元 素 )， 
则 函数 返回 1。 如 果 操 作成 功 ， 则 返回 0。 请 考虑 如 何 将 弹出 值 返回 给 调用 者 。 
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17.4 概述 


本 章 将 介绍 的 内 容 是 “递归 ” (recursive) ， 或 许 你 已 非常 熟悉 这 个 概念 。 例 如 ， 我 们 希望 在 一 
个 已 按 字 母 排 序 的 成 绩 单 中 ， 查 找 某 个 学 生 的 成 绩 。 通 常 的 做 法 是 ， 随 机 地 从 成 绩 单 中间 部 分 ， 
找 出 一 个 学 上 生 与 我 们 要 找 的 名 字 进 行 匹配 。 如 果 不 匹配 ， 则 比较 两 个 名 字 的 字母 顺序 关系 ， 在 成 
绩 单 当前 位 置 之 前 或 之 后 查找 。 之 后 的 查找 同样 是 采用 这 种 随机 匹配 的 方法 。 例 如 ， 我 们 要 查找 
的 学 生 是 “Babe Ruth”， 而 随机 看 到 的 是 “Mickey Mantle” 。 那 么 ， 下 一 步 查 找 则 是 在 其 后 半 部 
分 9 中 继续 查找 。 如 果 Babe Ruth 存 在 ， 则 我 们 应 该 很 快 就 能 找到 它 。 我 们 在 这 个 有 序 集合 中 查找 
元 素 ， 所 采用 的 方法 就 是 递归 ， 即 查找 的 集合 越 来 越 小 。 : 

所 谓 “ 递 归 ”， 其 思想 很 简单 : 递归 函数 通过 调用 自身 ， 完 成 更 小 的 子 任务 。 如 我 们 所 见 ， 递 
归 是 表达 循环 结构 的 一 种 特殊 方式 。 它 的 优点 在 于 ， 针 对 特定 任务 ， 它 能 更 清晰 地 表述 程序 控制 
流 的 执行 过 程 。 同 样 ， 即 使 针对 实际 的 编程 问题 ， 递 妇 方法 通常 也 可 以 替代 传统 的 循环 方法 。 在 
本 章 中 , 我 们 将 介绍 5 个 递归 编程 的 例子 , 并 了 解 在 LC-3 上 实现 递归 函数 的 机 制 。 美妙 的 “ 栈 机 制 ”， 
将 使 得 递归 的 实现 轻而易举 一 一 它 使 得 递归 函数 的 执行 过 程 与 普通 函数 完全 一 样 。 本 章 的 目的 是 ， 
帮助 你 深入 理解 递归 的 原理 ， 分 析 和 解释 几 个 递归 程序 。 因 为 ， 理 解 递 归 代 码 是 编写 递归 代码 的 
必要 前 提 。 最 后 ， 我 们 希望 你 能 在 实际 问题 的 求解 中 ， 应 用 递归 这 个 工具 。 


17.2 什么 是 递归 
我 们 称 一 个 调用 自身 的 函数 为 “递归 函数 "。 如 图 17-1 所 示 ，RunningSum 就 是 一 个 递归 函数 。 


1 int RunningSum(int n) 
2 















if (n == 1) 
return 1; 
else 
return (n + RunningSumín-1)); 








- O9 Uu (b uw 


} 


图 17-1 递归 函数 的 例子 


该 函数 的 任务 是 计算 输入 参数 n~1 之 则 所 有 整数 的 和 。 例 如 ，RunningSum(4) 所 计算 的 等 价 于 
表达 式 “4 + 3 + 2 + 1”。 只 是 ，RunningSum 采 用 的 是 递归 方法 。 注 意 ，1~4 的 求 和 与 4 与 1~3 的 求 
和 是 等 价 的 。 同 样 ，1~3 的 和 就 是 3 加 上 1~2 的 和 。 递 妇 定 义 是 递归 算法 的 基础 。 换 旬 话 说 ， 

RunningSum(n) = n + RunningSum(n-1) 

在 数学 上 ， 我 们 将 递归 函数 描述 为 如 上 所 示 的 “递归 等 式 ”(recurrence equation), fn, 4n 
上 所 示 的 就 是 RunningSum 的 递归 等 式 。 为 了 完成 该 等 式 的 计算 ， 我 们 还 需要 一 个 初始 值 。 即 在 上 
面 这 个 方程 式 中 ， 我 们 需 声 明 ， 


O HX "Babe Ruth" $i "Mickey Mantle” 之 间 的 顺序 关系 ， 两 者 之 间 比 较 的 是 “Ruth” 和 “Mantle”"， 所 以 
Ruth 在 Mantle 的 后 半 部 。 本 书 其 他 地 方 也 都 沿用 这 种 习惯 ， 即 在 排序 中 以 英文 的 姓 为 序 。 一 一 译 者 注 
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RunningSum(1) = 1 


递归 等 式 的 演算 过 程 如 下 所 示 : 
RunningSum(4)= 4 + RunningSum(3) 
=4+3+RunningSum(2) 
=4 +3 +2 + RunningSum(1) 
=4+3+2+1 
在 C 语 言 中 ，RunningSum 函 数 的 运算 过 程 与 该 递归 等 式 完 全 相同 。 在 RunningSum(4) 的 调用 执 
行 过 程 中 ，RunningSum 又 以 参数 3 调用 了 自身 ( 即 RunningSum(3)) ， 而 在 RunningSum(3) 结 束 之 
前 ， 又 调用 了 RunningSum(2)， 在 RunningSum(2) 中 则 又 调用 RunningSum(1)， 但 在 RunningSum(1) 
中 ， 它 不 再 递归 调用 ， 而 是 直接 返回 数值 1 给 RunningSum(2)， 然 后 ，RunningSum(2) 结 束 ， 返 回 
2+1 的 值 给 RunningSum(3)， 再 之 后 ，RunningSum(3) 结 束 ， 返 回 3+2+1 的 值 给 RunningSum(4)。 图 
17-2 所 示 是 RunningSum(4) 执 行 过 程 的 图 示 。 






ge (4) 







return (4 + RunningSum(3)): 


步骤 6 





[ningun (3) 





1 







返回 值 
6 


return (3 + RunningSum(2)); 






[ningun (2) 





return (2 + Running8um(1)):; 
PRI 

punningsum (1) 
return 1; 


图 17-2 RunningSum(4) 被 调用 时 的 控制 流程 






17.3 递归 与 循环 


当然 ， 我 们 也 可 以 使 用 循环 结构 (for 语句 ) 编写 RunningSum 函 数 ， 并 且 它 的 代码 将 比 递归 方 
法 更 容易 理解 。 但 在 此 ， 我 们 仍然 采用 了 递归 ， 目 的 就 是 通过 简单 的 例子 说 明 递归 调用 的 原理 。 

在 具体 程序 中 ， 究 竟 是 使 用 递归 还 是 使 用 循环 (如 for、while) 结构 ? ARE: 都 可 以 。 所 有 
的 递归 函数 都 可 以 编写 为 循环 结构 。 但 是 ， 在 有 些 问题 中 ， 递 归 将 比 循环 更 简捷 。 例 如 ， 那 些 很 
容易 表示 为 递归 等 式 的 问题 ， 就 很 适合 用 递归 方法 来 实现 。 至 于 判断 一 个 问题 是 采用 递归 方法 还 
是 循环 方法 更 容易 求解 ， 则 属于 “计算 机 编程 艺术 ”的 问题 了 。 在 有 了 一 些 编程 经 验 之 后 ， 你 自 
然 会 清楚 这 个 问题 的 答案 。 | 

在 通过 编程 解决 某 些 问题 时 ， 虽 然 递归 的 确 带 来 不 少 方便 ， 但 同时 也 会 付出 代价 。 例 如 ， 我 
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们 做 个 实验 ， 编 写 一 个 循环 版 的 RunningSum， 然 后 以 一 个 很 大 的 数值 n 做 参数 ， 比 较 它 和 递归 版 
程序 的 执行 时 间 。 你 可 以 调用 库 函 数 (如 gettimeofday) 记录 程序 执行 的 起 始 和 结束 时 间 。 经 过 几 
组 n 值 的 测试 ， 你 将 发 现 递归 版 的 程序 运行 相对 要 慢 一 些 (要 确认 编译 器 未 做 递归 优化 )。 我 们 将 
在 17.5 节 看 到 ， 其 中 的 原因 是 因为 递归 方式 导致 太 多 的 函数 调用 ， 而 循环 方法 没有 这 样 的 问题 。 


17.4 NER 


UE (Hanoi) 塔 是 个 古老 的 难题 ， 但 我 们 可 以 用 递归 方法 很 容易 地 解决 这 个 问题 。 汉 诺 塔 的 
问题 是 ， 如 图 17-3 所 示 ， 有 三 根 柱子 ， 其 中 的 一 根 套 着 一 操 圆 盘 ， 自 顶 向 下 ， 从 小 到 大 。 我 们 的 问 
题 是 ， 将 这 根 柱子 上 的 所 有 圆 盘 移 至 另 一 根 柱 子 上 。 但 是 ， 移 动 规则 有 两 条 : (1) 一 次 只 能 移动 
AAR, (2) 大 圆 盘 永 远 都 不 能 抬 在 小 圆 盘 之 上 。 在 图 17-3 中 ， 在 柱子 1 上 有 5 个 圆 盘 ， 请 按 规 
则 将 这 5 个 圆 盘 移 至 另 一 根 柱子 上 。 


柱子 1 柱子 2 柱子 3 


图 17-3 议 诸 塔 这 题 

有 关 这 个 谜 题 有 全 传 说 ;世界 诞生 时 ，Brahrma 寺 庙 的 僧人 受命 将 64 个 圆 盘 从 一 根 柱子 移 至 另 
一 根 柱子 上 。 一 旦 他 们 完成 了 这 个 任务 ， 世 界 末 日 也 就 到 了 。 

我 们 该 怎样 通过 程序 求解 这 个 难题 呢 ? 我 们 从 结果 开始 思考 ， 发 现 ; 当 移 动 最 后 一 个 圆 盘 时 ， 
必须 先 将 该 圆 盘 从 柱子 1 移 至 目标 柱子 ， 比 如 说 柱子 3， 然 后 再 将 其 他 圆 盘 (必然 是 在 柱子 2 中 ) 移 
至 它 的 上 面 。 所 以 ， 之 前 一 定 是 已 将 前 "一 1 个 贺 盘 从 柱子 1 全 部 搬移 到 了 中 间 那 根 柱 子 。 之 后 ， 再 
”将 -1 个 圆 盘 从 中 间 柱 子 移 至 目标 柱子 上 。 这 样 ， 就 完成 了 该 迹 题 。 当 然 ， 一 次 移动 x 一 1 个 贺 盘 是 
不 允许 的 ， 所 以 何 题 还 没完 全 解决 。 但 是 ， 我 们 现在 已 可 以 将 问题 分 解 为 两 个 更 小 的 子 问 题 。 换 
句 话说， 如 果 这 两 个 子 问 题解 决 了 ， 那 么 问题 就 真正 解决 了 。 其 中 ， 一 是 将 最 大 的 圆 盘 移 至 目标 
柱子 3 《这 很 容易 做 到 ， 因 为 柱子 3 现在 是 空 的 )， 之 后 我 们 再 也 不 用 关心 它 了 ， 二 是 n 一 1 个 圆 盘 的 
移动 (从 柱子 2 至 柱子 3)。 现 在 ,第 n-1 个 圆 盘 成 为 最 大 的 圆 盘 ， 所 以 问题 又 变 成 “怎样 将 最 大 的 
圆 盘 移 至 目标 柱子 上 ”， 这 就 是 原来 分 解 之 前 的 问题 (只 是 参数 由 n 变 为 +-1)。 因 此 ， 我 们 可 以 如 
法 炮制 地 解决 〈 即 继续 分 解 问题 ) 。 

现在 ， 我 们 将 这 个 问题 定义 为 如 下 的 递归 过 程 ; 将 该 任务 表示 为 Move(m, target), Mni Ai 
移 至 目标 柱子 上 。 首 先 要 做 的 是 Move(n 一 1, intermediate]， 即 将 前 “一 1 个 圆 盘 移 至 中 间 (intermediate) 
柱子 上 ， 然 后 将 盘 n 移 至 target 柱 子 ， 最 后 是 Move(n 一 1,target)， 即 将 鼻 n 一 1 从 intermediate 移 至 目标 柱 
子 。 所 以 ， 在 Moveln,target) 中 ， 将 两 次 递归 调用 Move 操 作 (都 是 移动 * 一 1 个 圆 盘 ) 。 

此 外 ， 如 同 数学 中 的 递归 方程 式 ， 递 归 定 义 中 也 需要 定义 递归 的 结束 条 件 (base case), TEX 
个 问题 中 ， 结 束 条 件 是 最 小 的 圆 盘 (HET) 被 移动 至 目标 柱子 。 因 为 ， 盘 1 总 是 在 最 上 面 ， 所 以 它 
的 移动 不 涉及 任何 其 他 盘 的 移动 ， 可 直接 移动 。 没 有 结束 条 件 ， 则 递归 函数 将 无 穷 递归 ;类似 循 
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环 操 作 的 无 限 循 环 。 
有 了 前 面 的 分 析 和 定义 ， 将 递归 定义 转化 为 C 代 码 就 相对 容易 了 。 图 17-4 所 示 是 该 算法 对 应 的 
C 递 归 国 数 。 


Inputs 
diskNumber is the disk to be moved (diskl1 is smallest) 
startPost is the post the disk is currently on 
endPost is the post we want the disk to end on 
midPost is the intermediate post 


MoveDisk(diskNumber, startPost, endPost, midPost) 


if (diskNumber > 1) { 
/* Move n-1 disks off the current disk on */ 
/* BtartPost and put them on the midPost */ 
MoveDisk(diskNumber-1, startPost, midPost, endPost); 


/* Move the largest disk. *f 
printf ("Move disk %d from post $d to post &d.Wn", 
diskNumber, startPost, endPost); 


/* Move all n-1 disks from midPost onto endPost */ 
MoveDisk(diskNumber-1, midPost, endPost, startPost); 


] 


else 
printf ("Move disk 1 from post $d to post %d.\n", 
startPost, endPost); 





图 17-4 解决 汉 诺 塔 这 题 的 递归 函数 


图 17-5 初始 的 汉 诺 塔 谜 题 


让 我 们 看 一 下 ， 在 只 有 三 个 贺 盘 的 情况 下 ， 程 序 的 执行 过 程 。 如 下 所 示 是 第 一 次 MoveDisk 限 
数 调 用 ， 即 将 要 把 盘 3 (最 大 的 圆 盘 ) 从 柱子 1 移 至 柱子 3， 并 以 柱子 2 为 中 介 。 换 名 话说 ， 这 是 一 
个 如 图 17-5 所 示 的 x = 3 的 Hanoi 塔 问题 。 

/* diskNumber 3; startPost 1; endPost 3; midPost 2 */ 

MoveDisk(3, 1, 3, 2) 

此 次 调用 中 ， 又 一 次 调用 MoveDisk， 试 图 将 盘 1 和 2 从 盘 3 上 移 开 ， 搬 至 柱子 2 (以 柱子 3 为 中 
介 )。 如 下 所 示 〈 源 代码 第 15 行 )。 


/* diskNumber 2; startPost 1; endPost 2; midPost 3 */ 
MoveDisk(2, 1, 2, 3) 


而 将 盘 2 从 柱子 1 移 至 柱子 2>， 前 提 是 先 将 盘 1 从 盘 2 上 移 至 柱子 3 (中 介 )。 所 以 ， 再 次 调用 
MoveDisk (第 15 行 )。 


/* diskNumber 1; startPost 1; endPost 3; midPost 2 */ 
MoveDisk(1, 1, 3, 2) 


之 后 ， 由 于 盘 1 可 直接 移动 ， 即 执行 第 二 个 printf 语 名 9 (第 25 行 )， 打 印信 息 如 下 : 


号 ”有 关 “ 移 动 ”操作 的 表示 ， 由 于 程序 还 无 法 显示 图 形 ， 所 以 每 做 一 次 移动 操作 ， 我 们 就 打印 一 个 信息 ， 蔡 
代 所 做 的 “移动 ”操作 。 你 可 以 按照 提示 ， 在 手边 的 模型 上 “按部就班 *"， 即 可 成 功 。 一 一 译 者 注 
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Move disk number 1 from post 1 to post 3. 


图 17-6 所 示 是 第 一 个 移动 操作 后 的 情况 。 





图 17-6 第 一 次 移动 后 的 汉 诺 塔 迹 题 


到 目前 为 止 ，MoveDisk 可 以 返回 调用 者 了 ， 即 MoveDisk(2, 1, 2, 3)。 回 顾 一 下 ， 在 这 个 调用 
者 中 ， 我 们 所 期 待 的 是 将 盘 2 之 上 的 所 有 圆 盘 都 移 至 柱子 3。 现 在 ， 这 个 任务 已 完成 。 所 以 ， 下 一 
个 操作 就 是 将 盘 2 从 柱子 1 移 至 柱子 2。 之 后 的 printf 语 名 (第 18 行 ) 即 执行 该 任务 ， 它 告诉 我 们 ， 又 
移动 一 个 圆 盘 了 。 

Move disk number 2 from post 1 to post 2. 

再 次 移动 后 的 情况 如 图 17-7 所 示 。 

Printf 之 后 是 一 个 MoveDisk 调 用 。 此 次 调用 的 任务 是 ， 将 原先 在 盘 2 之 上 的 圆 盘 移 回 盘 2 之 上 
(第 22 行 )。 


/* diskNumber 1; startPost 2; endPost 3; midPost 1 */ 
MoveDisk(1, 2, 3, 1) 


盘 1 之 上 没有 其 他 圆 盘 ， 所 以 直接 移动 。 我 们 看 到 输出 信息 。 


Move disk number 1 from post 3 to post 2. 


移动 后 的 情况 见 图 17-8 所 示 。 


(3) (2) (1) (8 
[o1 2 3 | [o1 02 3 j| 
图 17-7 第 二 次 移动 后 的 汉 请 塔 谜 是 图 17-8 第 三 次 移动 后 的 汉 诺 塔 谜 是 


现在 ， 控 制 权 返 回 MoveDisk(2, 1, 2, 3)， 即 已 将 盘 2 及 之 上 所 有 圆 盘 从 柱子 1 移 至 柱子 2。 随 后 ， 
控制 权 继续 返回 至 MoveDisk(3, 1, 3, 2)。 现 在 ， 副 3 之 上 的 圆 盘 都 已 经 移 至 柱子 2， 下 面 要 做 的 是 ， 
将 盘 3 从 柱子 1 移 至 柱子 3， 即 执行 Printf 语 句 (第 15 行 )。 

Move disk number 3 from post 1 to post 3. 

第 4 次 移动 后 的 结果 如 图 17-9 所 示 。 

接 下 来 的 任务 是 将 盘 2 及 之 上 的 所 有 圆 盘 从 柱子 2 移 至 柱子 3 (以 柱子 1 为 中 介 )。 于 是 ， 执 行 代 
码 第 22 行 的 调用 。 

/* diskNumber 2; startPost 2; endPost 3; midPost 1 */ 

MoveDisk(2, 2, 3, 1) 

首先 是 将 盘 1 从 柱子 2 移 至 柱子 1 (代码 的 第 15 行 )。 

/* diskNumber 1; startPost 2; endPost 1; midPost 3 */ 


MoveDisk(1, 2, 1, 3) 


该 移动 可 直接 操作 。 第 5 次 的 移动 结果 如 图 17-10 所 示 。 
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.Move disk number 1 form post 2 to post 1. 


图 17-9 第 四 次 移动 后 的 汉 诺 塔 谜 题 图 17-10 第 五 次 移动 后 的 汉 诺 塔 迹 题 
之 后 ， 返 回 到 调用 者 MoveDisk(2, 2, 3, 1)。 下 面 ， 可 以 将 盘 2 移 至 柱子 3。 第 6 次 的 移动 结果 如 
图 17-11 所 示 。 


.Move disk number 2 from post 2 to post 3. 


最 后 一 个 移动 操作 是 ， 将 盘 2 之 上 的 所 有 圆 盘 移 回 盘 2 之 上 。 调 用 代码 如 下 : 


/* diskNumber 1; startPost 1; endPost 3; midPost 2 */c 





MoveDisk(1, 1, 3, 2) 
完成 最 后 一 个 移动 之 后 的 结果 如 图 17-12 所 示 。 


-Move disk number 1 from post 1 to post 3. 


| | C1) 
(27) Ca 
C1) CEM CEND 
[o1 2 3 | L1 2 ^ 8 | 
图 17-11 第 六 次 移动 后 的 汉 诺 塔 谜 大 图 17-12 完成 后 的 汉 诺 塔 谜 古 
至 此 ， 谜 题解 出 。 


让 我 们 回顾 一 下 ， 在 三 个 圆 盘 的 Hanoi 塔 问题 的 求解 过 程 中 ，MoveDisk 国 数 的 递归 调用 。 


MoveDisk(3, 2) /* Initial Call */ 


i 
MoveDisk(2, 1 
MoveDisk(i, 1, 
MoveDisk(1, 2, 
MoveDiskí2, 2 
MoveDisk(1i, 2 
MoveDisk(1, 1 2 


. 3, 2) 
思考 一 下 ， 如 果 采 用 循环 结构 求解 该 问题 ， 程 序 应 该 怎么 写 ? 思考 之 后 ， 相 信 你 一 定 会 赞叹 
递归 方法 之 简洁 。 回 顾 Hanoi 塔 的 传说 当 寺 内 僧人 完成 64 个 圆 盘 的 文 解 后 ， 世 界 末 日 将 降临 。 试 
问 ， 如 果 每 移动 一 个 圆 盘 需要 一 秒 钟 ， 他 们 和 需要 多 久 才 能 完成 ? 


17.5 斐 波 纳 契 数 列 


下 面 的 这 个 递归 等 式 是 大 家 非常 熟悉 的 “ 右 波 纳 契 数列 ”(Fibonacci Numbers ) 。 该 数列 具备 
很 多 有 趣 的 数学 、 几 何 和 自然 特性 。 

f(n) 2 f (n-1) * f (n-2) 

f(D21 

f(0z21 

换 句 话说， 在 斐 波 纳 契 数列 中 ， 第 “个 数 是 其 之 前 两 个 数 的 和 ， 即 数列 为 1、1、2、3、5、8、 
13… 。 该 数列 最 早 是 由 意大利 数学 家 Leonardo of Pisa 在 1200 年 前 后 提出 的 ， 而 他 父亲 的 名 字 为 


Ww H Ww ww N) w 
= 
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Bonacci, 所 以 他 称 自 己 为 Fibonacci ( 即 filius Bonacci， 英 文章 思 是 son of Bonacci，Bonacci 的 儿子 )。 
Fibonacci 创 建 这 个 数列 的 目的 是 ， 计 算 兔子 的 饲养 数量 。 后 来 ， 我 们 发 现在 自然 界 中 也 充满 该 数 
列 ， 如 贝壳 上 的 螺旋 线 、 花 的 花瓣 模式 等 。 

我 们 可 以 为 这 个 递归 等 式 写 一 个 递归 函数 ， 计 算 第 2 个 辈 波 纳 契 数 。 其 中 ，Fibonacci(m) 的 结果 
可 以 通过 计算 “Fibonacci(n-1) + Fibonacci(n-2)” 的 递归 方法 获得 。 该 递归 的 结束 条 件 是 : 
Fibonacci(1) 和 Fibonacci(0) 都 直接 等 于 1。 图 17-13 所 示 是 计算 第 ?个 非 波 纳 契 数 的 递归 代码 。 

finclude <stdio.h> 
int Fibonacci (int n); 
int main() 

int in; 

int number; 


printf("Which Fibonacci number? "); 
Scanf("*d", kin); 


number = Fibonacci(in); 
printf("That Fibonacci number is $dàMn", number); 


int Fibonacci (int n) 
int sum; 


if (n == 0 || n == 1) 
return 1; 


else ( 
sum = (Fibonacci(n-1) + Fibonacci (n-2)); 


return sum; 


} 
} 


图 17-13 Fibonacci 是 一 个 递归 函数 ， 它 用 来 计算 第 n 个 斐 波 纳 契 数 


我 们 将 通过 这 个 例子 ， 讲 述 递 归 过 程 在 计算 机 系统 底层 的 实现 机 制 。 具 体 地 说 ， 就 是 通过 栈 
机 制 提供 对 递归 调用 的 支持 。 当 一 个 函数 被 调用 时 ， 不 管 调用 的 是 它 自己 还 是 其 他 函数 ， 总 是 要 
在 栈 空间 中 为 其 压 入 一 个 新 的 活动 记录 。 换 句 话 说 ， 函 数 每 次 被 调用 时 ， 都 会 有 一 个 私有 的 活动 
记录 拷贝 (包括 参数 和 局 部 变量 ) ， 相 辣 函 数 的 不 同调 用 ， 其 拷贝 是 不 一 样 的 (相互 之 间 不 存在 任 
何 关联 ) 。 这 恰巧 也 是 递归 所 需要 的 基本 要 求 。 例 如 ， 如 果 在 函数 中 ， 某 个 变量 在 内 存 中 所 占 的 位 
置 是 静态 分 配 的 ， 则 每 次 调用 Fibonacci 函 数 ， 都 将 覆盖 该 变量 在 前 一 次 调用 中 所 具有 的 数值 。 

下 面 ， 我 们 观察 一 下 以 参数 3 调用 Fibonacci 函 数 ( 即 Fibonacci(3)) 的 情况 。 最 开始 ， 
Fibonacci(3) 的 活动 记录 被 压 人 栈 。 图 17-14 所 示 是 此 次 调用 后 的 栈 状态 。 

进入 Fibonacci(3) 函 数 体 之 后 ， 由 于 表达 式 “Fibonacci(n-1) + Fibonacci(n-2)” 的 计算 顺序 是 自 
左 向 右 ， 所 以 先 计算 Fibonacci(3-1) 的 结果 ， 即 Fibonacci(2)。 随 后 ，Fibonacci(2) 的 活动 记录 又 被 压 
入 栈 〈 如 图 17-14 的 步 又 2 所 示 ) 。 

对 于 Fibonacci(2) 来 说 ， 参 数 n = 2， 不 满足 结束 条 件 ， 所 以 再 次 产生 Fibonacci(1) 调 用 (如 图 
17-14 的 步骤 3)。 该 调用 是 在 Fibonacci(2-1) + Fibonacci(2-2) 中 产生 的 。 

而 Fibonacci(1) 则 不 再 需要 递归 调用 (因为 参数 n = 1 已 满足 结束 条 件 ) 。 它 将 直接 返回 结果 1 至 
Fibonacci(2)。 随 后 是 Fibonacci(0) 的 调用 ， 最 后 完成 “Fibonacci(1) + Fibonacci(0)” 的 计算 (如 图 
17-14 的 步骤 4)。 其 中 ，Fibonacci(0) 也 直接 返回 1。 

至 此 ，Fibonacci(2) 调 用 完成 。 它 再 将 结果 (为 2) 返回 给 它 的 调用 者 Fibonacci(3)。 表 达 式 
Fibonacci(2) + Fibonacci(1) 的 左 半 部 完成 之 后 ，Fibonacci(3) 继 续 调用 Fibonacci(1) (如 图 17-14 的 步 
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Fibonacci (3) 








Fibonacci(3) 


步骤 1: 函数 调用 初始 化 


em 


JpUE3. Fibonacci(2) 调 用 Fibonacci(1) 










R6 





Fibonacci (1) 
Fibonacci (3) 


HES, Fibonacci(3) 调 用 Fibonacci(1) 






R6 








Fibonacci (2) 
Fibonacci (3) 


步骤 2，Fibonacei(3) 调 用 Fibonacci(2》 


Fibonacci (0) 
Fibonacci (2) 
Fibonacci (3) 
EN 


步骤 4，Fibonacci(2) 调 用 Fibonacci(O) 


R6 









Fibonacci (3) 


ERG: 返回 开始 点 


图 17-14 Fibonacci(3) 调 用 过 程 中 的 运行 时 栈 快照 
如 果 我 们 将 Fibonacci(3) 的 递归 过 程 表示 为 代数 表达 式 ， 则 如 下 所 示 : 


"ow oa 


11-41-23 


Fibonacci(2) + Fibonacci(1) 
(Fibonacci(1) + Fibonacci(0)) + Fibonacci(1) 


在 Fibonacci(3) 的 计算 过 程 中 ， 函 数 调 用 顺序 如 下 所 示 : 


Fibonacci (3) 
Fibonacci (2) 
Fibonacci (1) 
Fibonacci (0) 
Fibonacci (1) 


£17* 


URS), krp, Fibonacci(1) & GR [Bl 1, "FAEFibonacci(3) BH Sz, RAI (如 图 17-14 的 步骤 6) 。 
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如 果 将 Fibonacci(4) 的 计算 过 程 写 出 来 ， 你 将 发 现 Fibonacci(3) 的 调用 顺序 包含 在 Fibonacci(4) 的 
调用 顺序 之 中 。 原 因 很 简单 ， 因 为 Fibonacci(4) = Fibonacci(3) + Fibonacci(2)。 同 样 ，Fibonacci(4) 
的 调用 顺序 也 是 Fibonacci(5) 调 用 顺序 的 一 部 分 。 在 本 章 最 后 ， 有 一 个 习题 ， 计 算 Fibonacci(n) 的 计 
算 过 程 中 函数 调用 发 生 的 次 数 。 

图 17-15 所 示 是 该 程序 在 LC-3 C 编 译 器 下 生成 的 代码 。 注 意 ， 在 这 段 代 码 的 生成 过 程 中 ， 编 译 
器 未 对 递归 做 优化 处 理 。 由 于 都 是 基于 栈 机 制 ， 所 以 对 于 活动 函数 是 递归 函数 还 是 普通 函数 ， 编 
译 器 都 是 同等 对 待 的 。 仔 细 阅 读 代 码 ， 你 将 发 现 ， 编 译 器 为 能 正确 翻译 Fibonacci 函 数 的 第 24 行 ， 
使 用 了 一 个 额外 的 临时 变量 。 很 多 编译 器 在 翻译 较 复杂 的 表达 式 时 ， 都 会 使 用 类 似 的 临时 变量 。 
临时 变量 的 空间 分 配 在 活动 记录 中 程序 声明 的 局 部 变量 之 上 。 





1 Fibonacci: 

2 ADD R6, R6, #-2 ; push return value/address 

3 STR R7, R6, #0 ; store return address 

4 ADD R6, R6, #-1 ; push caller's frame pointer 

5 STR R5, R6, #0 ; 

6 ADD R5, R6, #-1 ; set new frame pointer 

7 ADD R6, R6, H-2 ; allocate space for locals and temps 
8 





9 LDR RO, R5, H4 ; load the parameter n 
10 BRZ FIB BASE ; n==0 

11 ADD RO, RO, 4-1 ; 

12 BRZ FIB BASE H 

13 

14 LDR RO, R5, #4 
15 ADD RO, RO, #-1 





; n==1 





; load the parameter n 
; calculate n-1 









16 ADD R6, R6, d-1 ; push n-i 

17 STR RO, R6, #0 ; 

18 JSR Fibonacci ; call to Fibonacci (n-1) 

19 

20 LDR RO, R6, #0 ; read the return value at top of stack 






i 
21 ADD R6, R6, #-1 ; pop return value 

22 STR RO, R5, 4-1 ; store it into temporary value 
23 LDR RO, R5, #4 ; load the parameter n 







24 ADD RO, RO, 4-2 ; calculate n-2 
25 ADD R6, R6, #-1 ; push n-2 

26 STR RO, R6, #0 

Fibonacci 










; call to Fibonacci (n-2) 






read the return value at top of stack 
; pop return value 

read temporary value: Fibonacci (n-1) 
Fibonaccií(n-1) + Fibonacci (n-2) 
branch to end of code 


29 LDR RO, R6, #0 
30 ADD R6, R6, #-1 
31 LDR R1, R5, #-1 
32 ADD RO, RO, R1 
33 BR FIB_END 
















FIB_BASE: 
36 AND RO, RO, #0 ; clear RO 
ADD RO, RO, #1 ; RO = 1 











FIB_END: 
40 STR RO, R5, #3 ; write the return value 









+ 
41 ADD R6, R5, #1 ; pop local variables 
42 LDR R5, R6, #0 ; restore caller's frame pointer 
43 ADD R6, R6, #1 ; 
44 LDR R7, R6, #0 ; pop return address 


R6, 






图 17-15 Fibonacci 国 数 对 应 的 LC-3 汇 编 代 码 


17.0 二 分 查找 
在 本 章 的 概述 部 分 ， 我 们 曾 描 述 了 这 样 一 种 操作 : 在 一 个 已 按 字母 表 排 序 的 成 绩 集合 中 ， 通 
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过 递归 方法 查找 某 个 同学 的 成 绩 。 我 们 称 这 种 方法 为 “二 分 查找 ”(binary search) 。 这 种 方法 非常 
适合 在 有 序 集合 中 查找 特定 元 素 。 下 面 ， 我 们 将 在 递归 和 数组 的 基础 上 ， 实 现 一 个 二 分 查找 的 C 递 
归 函 数 。 

假设 我 们 将 在 一 个 升序 排列 的 整 型 数组 中 ， 查 找 某 个 特定 整数 。 如 果 查 找到 了 ， 则 函数 返回 
该 整数 在 数组 中 的 索引 号 ， 如 果 未 找到 ， 则 返回 -1。 在 该 任务 中 ， 我们 可 以 采用 “二 分 查找 ”方法 : 
给 定 一 个 数组 和 被 查找 的 整数 ， 我 们 先 匹 配 数组 中 间 的 数 ， 判 断 被 查找 整数 :(1) 等 于 该 中 间 
数 ，(2) 小 于 中 间 数 ，(3) 大 于 中 间 数 。 如 果 相 等 ， 则 匹配 成 功 ， 如 果 小 于 中 间 数 ， 则 进入 数组 
的 前 半 部 ， 并 采用 相同 方法 继续 查找 ， 如 果 大 于 中 间 数 ， 则 进入 数组 后 半 部 ， 并 采用 同样 方法 查 
找 。 注 意 , 在 (2) 和 (3) 的 情况 中 ， 我 们 可 以 采用 递归 调用 。 但 是 ， 如 果 数 组 中 根本 就 没有 我 
们 要 找 的 这 个 数 ， 情 况 会 如 何 呢 ? 在 递归 方式 中 ， 每 次 递归 调用 总 是 在 比 原 数组 更 小 的 子 数组 中 
查找 。 所 以 ， 如 果 被 查找 的 数 不 存 在 ， 则 最 终 将 是 对 一 个 空 数 组 ( 即 数组 大 小 为 0) 进行 查找 。 遇 
到 这 种 情况 时 ， 函 数 直 接 返 回 -1。 实 际 上 ， 这 就 是 该 递归 的 结束 条 件 。 

图 17-16 所 示 是 二 分 查找 算法 的 C 递 归 代 码 。 注 意 ， 为 保证 在 每 级 调用 中 都 能 判断 出 数组 的 大 
小 ，BinarySearch 调 用 的 传人 参数 中 ， 包 含 了 当前 子 数组 的 起 始 和 结束 位 置 。 在 每 次 调用 时 ， 变 量 
start 和 end 的 值 都 会 被 重新 定义 ， 即 在 原 数组 list 中 越 来 越 小 的 子 数组 中 查找 。 

图 17-17 显 示 的 是 这 段 代码 的 执行 流程 。 基 中， 数组 list 有 11 个 元 素 。 在 BinarySearch 的 最 初 调 
用 中 ， 传 递 的 参数 包括 : 要 查找 的 元 素 (item) 和 被 查找 数组 (回顾 第 16 章 ， 传 递 的 是 数组 中 第 一 
个 元 素 的 地 址 或 数组 基地 址 )。 此 外 ， 还 包括 数组 的 查找 范围 ， 即 起 始 位 置 和 结束 位 置 。 而 每 一 次 
BinarySearch 的 递归 调用 中 ， 该 范围 将 越 来 越 小 ， 直 到 被 查找 子 集中 只 有 一 个 或 者 没有 元 素 为 止 。 
这 两 种 情况 是 递归 的 结束 条 件 。 

反之 ， 如 果 不 借助 二 分 查找 技术 ， 我 们 可 以 采用 直观 的 顺序 查找 方法 。 即 依次 匹配 listf0]、 
list[1] 、list[2]…… 等 ， 直 到 匹配 成 功 或 数组 结尾 。 但 是 ， 在 二 分 查找 方法 中 ， 匹 配 次 数 更 少 ， 尤 
其 是 在 数组 足够 大 的 时 候 ， 它 的 执行 速度 更 快 。 在 后 续 的 计算 机 课程 中 ， 你 还 将 学 习 二 分 查找 算 
法 的 分 析 结 果 ， 它 的 运行 时 间 复 杂 度 是 logzn 〈" 是 数组 大 小 ) ， 而 顺序 查找 的 复杂 度 则 是 "。 


/* 

** This function returns the position of 'item' if it exists 
** between list[start] and list([end], or -1 if it does not. 
*/ 


int BinarySearch(int item, int list(], int start, int end) 


int middle - (end « start) / 2; 


/* Did we not find what we are looking for? */ 
if (end « start) 
return -1; 


/* Did we find the item? */ 
else if (list[middle] -- item) 
return middle; 


/* Should we search the first half of the array? */ 
else if (item < list[midd1le)) 
return BinarySearch(item, list, start, middle - 1); 


/* Or should we search the second half of the array? */ 
else 
return BinarySearch(item, list, middle + 1, end); 





图 17-16 执行 二 分 查找 的 递归 C 函 数 


start middle end 





BinarySearch(109, array, 0, 10) 


start middle end 


list E 





BinarySearch(109, array, 0, 4) 


middle 


list 





BinarySearch(109, array, 3, 4) 


middle 
start| end 





BinarySearch(109, array, 4, 4) 


图 17-17 在 一 个 含有 11 个 元 素 的 数组 里 使 用 二 分 查找 : 我 们 要 找 的 是 元 素 109 


17.7 ”整数 转换 为 ASCI| 字 符 串 


关于 递归 函数 的 最 后 一 个 例子 ， 是 将 一 个 整数 值 转换 为 ASCII 字 符 串 。 回 顾 第 10 章 的 内 容 ， 为 
在 屏幕 上 显示 一 个 整数 值 ， 该 整数 的 每 一 位 都 被 单独 取出 ， 然 后 转换 为 对 应 的 ASCII 字 符 ， 最 后 输 
出 显示 。 在 第 10 章 中 ， 我 们 使 用 的 是 直接 循环 方法 编写 LC-3 程 序 。 
下 面 ， 我 们 将 采用 递归 方法 来 完成 : 如 果 被 显示 整数 只 有 一 位 ， 则 将 它 直接 转换 为 ASCII 字 符 
并 输出 (ERRE) ， 如 果 被 显示 的 整数 有 多 位 ， 我 们 对 除 最 低位 (最 右边 ) 之 外 的 数 进行 递归 
调用 ， 递 归 调 用 返回 时 再 显示 最 右边 的 数 。 


#include «stdio.h» 
void IntToAscii (int i); 
int main() 


int in; 


printf("Input number: "); 
scanf("td", &in); 


图 17-18 递归 函数 IntToAscii， 将 一 个 正 整数 转化 为 ASCII 字 符 串 
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IntToAscii(in); 
printf ("Wn"); 


void IntToAscii(int num) 


int prefix; 
int currDigit; 


if (num « 10) /* The terminal case 
printf("$c", num + '0'); 

else { 
prefix - num / 10; /* Convert the number 
IntToAscii (prefix); /* without last digit 


currDigit = num $ 10; /* Then print last digit 
printf("$c", currDigit + '0'); 





图 17-18 递归 国 数 ntToAscii， 将 一 个 正 整 数 转化 为 ASCH 字 符 串 〈 续 ) 


递归 函数 mtToAscii 的 工作 流程 如 下 : 假设 要 显示 的 整数 是 21 669 (函数 调用 IntToAscii(21669))， 
在 该 函数 中 ， 问 题 被 分 为 两 部 分 。 一 是 调用 递归 函数 IntToAscii 显 示 “2166”:，， 二 是 在 调用 返回 后 ， 再 
显示 “g” 。 

在 代码 中 ， 我 们 采用 除 以 10 的 方法 去 除 参数 num 的 最 低位 ， 然 后 将 结果 (也 是 更 小 的 ) 整数 传 
递 给 下 一 级 递归 调用 。 如 果 num 只 有 一 位 ， 则 将 它 转换 为 ASCII 宇 符 并 显示 ， 即 不 再 继续 递归 调用 。 

当前 级 别 的 函数 返回 调用 者 之 后 ， 则 将 刚才 的 余数 (最 低位 的 数 ) 转换 为 ASCII 字 符 并 显示 。 
为 验证 该 过 程 ， 我 们 给 出 intToAscii(12345) 调 用 过 程 的 调用 序列 ， 如 下 所 示 : 

IntToAscii(12345) 

IntToAscii(1234) 

IntToAscii(123) 

IntToAscii(12) 

IntToAscii(1) 

printfí'1i') 

printf('2') 

printf('3') 

printfí'4') 

printf('5') 


17.8 小 结 

在 本 章 中 ， 我 们 介绍 了 递归 的 概念 。 所 谓 “递归 "， 就 是 通过 递归 地 调用 自身 程序 ， 完 成 问题 
的 子 任务 。 在 递归 中 ， 我 们 定义 函数 fl(n)。 而 表达 式 f(n 一 1) 则 代表 将 同样 的 函数 作用 于 一 个 比 n 更 小 
的 参数 。 例 如 ， 斐 波 纳 契 数 列 的 递归 表示 如 下 所 示 : 

Fibonacci(n} = Fibonacciín-1) + Fibonacci (n-2); 

为 保证 递归 过 程 最 终 能 够 终止 ， 还 必须 有 一 个 结束 条 件 。 

在 编程 中 ， 递 归 ， 是 一 个 非常 有 用 的 工具 。 在 合适 的 情况 下 ， 它 可 以 使 问题 变 得 非常 简单 。 
例如 ， 通 过 递归 方法 ， 就 可 以 非常 简单 地 解决 Hanoi 塔 问题 。 相 比 之 下 ， 采 用 循环 方法 建立 方程 则 
非常 困难 。 在 后 续 的 课程 里 ， 我 们 还 将 学 习 很 多 使 用 了 “指针 ”的 数据 结构 (如 树 、 图 ) ， 其 中 ， 
操作 它们 最 简单 的 方法 就 是 采用 递归 函数 。 对 于 计算 机 底层 来 说 ,递归 函数 的 处 理 与 普通 函数 没 
有 区 别 。 因 为 ， 在 栈 机 制 方式 下 ,我 们 将 为 任何 一 个 函数 的 任何 一 次 调用 ， 都 独立 地 分 配 一 个 活 
动 记录 空间 。 因 而 ， 即 使 是 间 一 个 函数 ， 不 同调 用 的 活动 记录 之 间 不 存在 任何 冲突 。 


17.9 习题 
17.1 试 根据 本 章 给 出 的 例子 ， 回 答 下 列 问题 。 


17.2 
17.3 


17.4 


17.5 
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a. 如 果 执 行 RunningSum(10)， 试 问 RunningSum (17.235) 将 被 调用 多 少 次 ? 

b. 如 果 调 用 RunningSum(n) 昵 ?以 n 为 参数 表示 结果 。 

c. 在 Hanoi 塔 问题 中 ， 如 果 开 始 的 函数 调用 是 MoveDisk(4, 1, 3, 2)， 试 问 MoveDisk 将 被 调用 
多 少 次 ? 

d. 在 "个 圆 盘 的 Hanoi 塔 问题 中 ， 共 有 多 少 次 函数 调用 呢 ? 

e. 如 果 调 用 Fibonacci(10)， 试 问 Fibonacci 函 数 〈 见 图 17-13) 将 被 调用 多 少 次 ? 

f. 如 果 计 算 第 “个 斐 波 纳 契 数 ， 试 问 有 多 少 次 函数 调用 ? 

试问 ， 在 递归 函数 的 每 次 调用 中 ， 返 回 地 址 都 是 一 样 的 吗 ? 为 什么 ? 

在 如 图 17-18 所 示 的 IntToAscii 函 数 中 ， 如 果 我 们 将 printf 和 递归 调用 之 间 的 位 置 调换 一 下 ， 
结果 会 如 何 ? 

阅读 如 下 函数 ， 函 数 调用 count(20) 的 结果 是 多 少 ? 

int count (int arg) 


if (arg < 1) 
return 0; 


else if (arg $% 2) 
return(1 + count(arg - 2)); 
"else 
return(l + count (arg - 1)); 
) 


阅读 如 下 所 示 C 程 序 ， 回 答 问 题 : 


#include <stdio.h> 
int Power(int a, int b); 


int main(void) 
{ 


int x, y, z; 


printf("Input two numbers: "); 
scanf ("$d &d", &x, &y); 


if (X > 0 && y > 0) 
z = Power(x,y); 
else 
z= 0; 


printf("The result is %d.\n", z}; 


) 


int Power(int a, int b) 
{ 
‘if (a < b) 
return 0; 
else 
return 1 + Powerí(a/b, b); 


) 

a. 给 定 以 下 输入 ， 给 出 完整 输出 。 
(1)49 

(2) 27 5 

(3) -13 

b. Power 函 数 的 功能 是 什么 ? 
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c. 图 17-19 所 示 是 Power 函 数 调用 后 的 栈 快照 。 其 中 ， 显 示 的 是 两 段 活 动 记录 ， 且 部 分 内 容 
已 填写 。 假 设 该 快照 反映 的 是 Power 函 数 中 某 个 return 语 句 执 行 之 前 的 情况 ， 试 填写 图 中 标 
记 为 问号 (?) 的 位 置 内 容 。 如 果 位 置 内 容 是 地 址 值 ， 请 用 箭头 标 出 该 地 址 所 指向 的 位 置 。 





图 17-19 Power 函 数 调用 后 的 运行 时 栈 


17.6 ”阅读 如 下 C 函 数 ， 回 答 问题 : 
int Sigma( int k ) 
i int 1; 
l =k -1; 
if (k==0) 
return 0; 


else . 
return (k + Sigma(1)); 
} 


a. 将 该 递归 函数 转换 为 一 个 非 递归 函数 。 假 设 其 中 Sigma0 的 调用 参数 总 是 非 负 的 值 。 
b. 假设 有 一 个 1KB 大 小 的 连续 栈 空间 ， 且 地 址 和 整 型 数 的 宽度 都 是 16-bit。 试 问 ， 访 有限 大 
小 的 空间 能 容纳 多 少 次 递归 调用 ? 临时 变量 的 存储 空间 不 计算 在 内 。 

17.7 假设 如 下 C 程 序 编译 后 在 LC-3 上 运行 。 程 序 执行 时 ， 栈 的 起 始 地 址 是 xFEFF， 增 长 方向 是 
xC000 ( 即 栈 的 最 大 占用 内 存 大 小 是 16KB ) 。 试 回答 问题 


SevenUp(int x) 
if (x -- 1) 
return 7; 
else 
return (7 + sevenUp(x - 1)); 
} 
int main() 
int a; 


printf("Input a number Vn"); 
scanf("*d", &a); 


a - SevenUp(a) ; 


printf ("$d is 7 times the numberWn", a); 
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a. 为 保证 程序 顺利 运行 ， 最 大 的 输入 值 是 多 少 ? 解释 理由 。 
b. 如 果 最 大 栈 空 间 是 4KB， 则 最 大 可 能 的 输入 值 又 是 多 少 ? 解释 理由 。 

17.8” 试 编写 循环 版 本 的 辈 波 纳 契 函数 ， 它 可 以 找 出 第 "个 辈 波 纳 契 数 。 然 后 ， 在 不 同 的 " 取 值 下 ， 
比较 循环 版 本 和 递归 版 本 的 运行 时 间 。 试 问 ， 为 何 当 " 足 够 大 时 ， 递 归 版 本 的 运行 时 间 要 慢 
很 多 ? 

17.9 如 图 17-16 所 示 的 二 分 查找 程序 ， 只 能 查找 技 升序 排序 的 数组 。 试 重 写 这 段 代 码 ， 使 之 能 够 
查找 按 降序 排序 的 数组 。 

17.10 “如 下 递归 方式 实现 的 算法 ， 其 代码 表示 比 循环 方式 的 代码 要 容易 得 多 。 试 给 出 问题 a~c 的 返 
回 值 ， 并 回答 最 后 一 个 问题 。 

int ea(int x, int y) 
int a; 
if (y -- 0) 
return X; 
else ( 


a-xt$*y; 
return (eaí(y, al); 


) 
a. ea(12, 15) 


b. ea(6, 10) 

c. ea(110, 24) 

d. 该 函数 的 作用 是 什么 ? WAEA RIER. 
17.11 阅读 如 下 C 代 码 ， 试 编写 一 个 非 递 归 方 式 的 代码 。 

int main() 


printf ("%d", M(); 


void M() 


int num, x; 

printf ("Type a number: "); 
scanf ("%d", &num); 

if (num <= 0) 


return 0; 
else ( 
x = MO 


if (num » x) 
return num; 
else 
return x; 


} 
17.12 ”阅读 如 下 递归 函数 ， 回 答 问 题 ， 
int func (int arg) 
if (arg $ 2 !- 0) 
return func (arg - 1); 
if (arg <= 0) 


return 1; 


return func(arg/2) + 1; 


a. 是 否 存在 一 个 arg 的 值 ， 能 导致 无 限 递归 ? 如 果 有 ， 请 给 出 这 个 值 。 
b. 如 下 所 示 ， 在 main 函 数 中 调用 func 消 数 。 试 问 该 程序 执行 过 程 中 ，func 函 数 共 被 调用 了 
“多少 次 ? 
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int main() 


printf ("The value is d\n", func(10)); 


17.13 如 下 所 示 是 一 个 递归 函数 ， 其 输入 和 参数 是 一 个 不 定 长 的 字符 串 ， 读 函数 将 判断 字符 串 内 出 
现 的 圆 括号 是 否 成 对 匹配 。 函 数 Balanced 的 作用 是 匹配 圆 括号 。 如 果 字 符 数 组 中 的 圆 括号 成 
对 匹配 ， 则 冰 数 返回 0， 和 否则 返回 非 0 值 。 函 数 Balanced 的 最 初 调用 是 Balanced(string, 0, 0)。 
但 是 ， 下 面 的 Balanced 函 数 中 缺少 一 些 关键 代码 ， 请 填写 出 来 。 


int Balanced(char string[], int position, int count) 


if ( ) 
return count; 


else if (stringlposition] == ) 
return Balanced( string, ««position, ««count); 


else if (string[íposition] == ) 
return Balanced(.string, ++position, --count); 
else 


return Balanced( string, ««position, count); 


) 
1714 试问 ， 如 下 C 程 序 的 输出 结果 是 什么 ? 


#include <stdio.h> 


void Magic(int in); 
int Even(int n); 


int main() 
( 
Magic(10); 


} 


void Magic(int in) 
{ 
if (in == 0) 
return; 
if (Even(in)) 
printf("$iWMn", in); 
Magic(in - 1); 
if (!Even(in)) 
printf("*iWn", in); 
return; 


] 


int Even(int n) 


{ 


/* even, return 1; odd, return O */ 
return (n $ 2) == 0 ? 1: 0; 
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18.1 概述 


任何 有 用 的 程序 ， 都 需要 对 外 输出 信息 ， 或 是 输出 至 屏幕 ， 或 是 输出 至 文件 ， 甚 至 可 能 输出 
至 网 络 上 的 另 一 台 计算 机 。 另 外 ， 很 多 程序 还 需要 用 户 输入 数据 才能 运行 。 但 是 ， 如 同 大 多 数 的 
现代 编程 语言 一 样 ，C 语 言 本 身 并 不 支持 输入 输出 操作 。 相 反 ， 输 入 /输出 (简称 WO) 的 处 理 功能 
是 由 标准 库 函 数 提供 的 。 而 ANSI C 标 准 ， 则 对 这 些 库 函数 的 功能 和 接口 做 了 标准 化 的 定义 。 

本 章 将 介绍 几 种 标准 的 1/O 库 函数 。 其 中 ，putchar 和 printf 的 功能 是 输出 信息 ，getchar 和 scanf 
的 功能 是 读 取 输入 信息 。 更 通用 的 函数 形式 ， 如 fprintf 和 fscanf， 则 是 执行 文件 WO， 如 磁盘 上 的 文 
件 。 有 关 printf 和 scanf， 更 是 在 本 书 第 二 部 分 内 容 中 到 处 可 见 。 本 章 将 对 这 些 函 数 的 实现 细节 展开 
讨论 ， 对 其 中 的 可 变 参数 ， 及 其 LC-3 栈 的 参数 传递 机 制 ， 做 详细 的 分 析 研 究 。 


18.2 CHEREN 


标准 库 函 数 只 是 C 语 言 的 扩展 内 容 ， 它 负责 输出 /输出 、 字 符 串 操作 、 数 学 函数 、 文 件 存 取 和 
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通用 接口 。 我 们 可 以 将 标准 库 看 做 是 一 个 仓库 ， 它 为 用 户 构 建 复杂 软件 提供 了 必需 的 部 件 
(component)。 现 在 流行 的 程序 设计 语言 ， 如 C++ 和 Java， 都 是 通过 库 函 数 的 形式 向 用 户 提 供 的 孙 
数 接口 。 附 录 D.9 中 是 常用 的 一 些 C 库 函数 。 库 函数 也 是 程序 ， 它 们 的 编写 者 通常 是 那些 操作 系统 
和 编译 器 的 设计 者 。 针 对 不 同 的 运行 系统 ， 编 写 者 通常 对 这 些 库 函数 做 了 精心 优化 。 

所 有 的 标准 库 函 数 ， 根 据 它们 功能 的 不 同 ， 划 分 为 多 个 组 。 而 每 个 功能 组 ， 又 对 应 一 个 头 文件 
(header file 或 *.h 文 件 )。 如 果 要 使 用 特定 组 的 库 函 数 ， 则 编程 者 要 在 自己 的 程序 中 包含 对 应 的 头 文 
件 。 例 如 ， 如 果 要 使 用 数学 函数 sin 和 tan， 则 包含 math.h 头 文件 ， 再 如 ， 标 准 输入 输出 函数 ， 对 应 
的 是 stdio.h 文 件 。 头 文件 的 内 容 是 函数 声明 及 相关 的 宏 定 义 ， 但 不 包含 这 些 函 数 的 真正 实现 代码 。 

问题 是 ， 如 果 头 文件 中 没有 库 国 数 的 源 代码 ， 那 么 最 终 的 程序 映像 中 ， 从 哪里 获取 这 些 库 函 
数 (如 printf) 的 代码 ? 答案 是 ， 饵 数 库 中 的 代码 通常 都 是 二 进 制 形式 的 ， 存 储 在 系统 指定 的 上 且 标 
文件 中 。 只 有 链接 程序 能 访问 它们 (事实 上 ， 只 有 链接 程序 能 读 慌 它们 的 格式 )。 在 程序 编译 的 最 
后 阶段 ( 即 链接 阶段 )， 由 链接 程序 负责 ， 将 库 函 数 的 二 进 制 代 码 和 用 户 程 序 的 二 进 制 代码 拼装 在 
一 起 ， 形 成 最 终 的 可 执行 程序 。 

顺便 说 一 下 ， 以 上 场景 描述 的 是 程序 的 静态 链接 方法 ， 而 很 多 情况 下 ， 库 函数 还 可 以 “动态 ” 
地 被 链接 (这 种 情况 下 ， 国 数 库 的 格式 是 动态 链接 库 (dynamically linked libraries, DDL) 或 共享 
库 ) 。 在 动态 链接 库 方 式 下 ， 库 函数 的 二 进 制 代码 不 出 现在 可 执行 代码 中 ， 而 是 在 程序 运行 时 ， 接 
需 装 人 内 存 。 


18.3 字符 MO 操作 


我 们 先 介绍 两 个 最 简单 的 MO 函 数 ，getchar 和 putchar， 它 们 每 次 只 处 理 一 个 字符 。 类 似 LC-3 的 
IN 和 OUT 指令 ，getchar 每 次 读 人 一 个 输入 字符 的 ASCH 码 值 ，putchar 则 输出 字符 的 ASCI 码 值 。 
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18.3.1 OX 


概念 上 ， 所 有 基于 字符 的 输入 /输出 操作 都 是 “ 流 ” 方 式 的 。 例 如 ， 从 键盘 顺序 输入 的 ASCII 
字符 ， 就 是 一 个 流 输入 的 例子 。 用 户 每 输入 一 个 新 字符 ， 该 字符 都 被 添加 到 流 的 尾部 ， 而 键盘 读 
取 则 是 从 流 的 头 部 获取 数据 ， 再 如 ，ASCII 字 符 的 打印 也 是 流 操作 ， 每 次 输出 的 字符 也 是 添加 到 输 
出 流 的 尾部 。 所 谓 “ 流 ”"， 简 单 地 说 ， 就 是 操作 系统 为 /O 设 备 创建 的 一 个 FIFO( 先 进 先 出) 缓冲 。 基 
于 抽象 概念 的 “ 流 ”"， 我 们 可 以 建立 起 “生产 者 ”( 如 键盘 输入 ) 和 “消费 者 ”( 如 键盘 读 取 程序 ) 
的 配对 角色 ， 并 因此 解决 了 输入 和 读 取 之 间 的 速度 不 匹配 问题 (参见 第 8 章 )。 以 一 个 字符 输出 程 
序 为 例 ， 如 果 没 有 输出 流 的 存在 ， 则 程序 每 输出 一 个 字符 之 前 ， 都 必须 确认 前 一 个 字符 的 输出 操 
作 是 否 已 完成 。 而 有 了 输出 流 ， 程 序 只 需要 直接 将 字符 输出 到 输出 流 中 即 可 ， 而 不 必 关 心 输出 设 
备 的 状态 。 其 他 语言 ， 如 C++， 也 都 提供 类 似 的 MO 流 抽象 。 

在 C 语 言 中 ， 标 准 输入 流 就 是 stdin。 上 默认 情况 下 ，stdin 代 表 的 就 是 键盘 。 而 标准 输出 流 是 
stdout， 软 认 情况 下 ， 它 代表 显示 器 。 国 数 getchar 的 任务 ， 就 是 从 stdin 中 读 取 一 个 字符 ， 国 数 
putchar 的 任务 则 是 向 stdout 输 出 一 个 字符 。 


18.3.2 putchari š 


函数 putchar 和 LC-3 的 OUT 指 令 相 似 ， 它 的 功能 是 将 参数 (一 个 字符 ) 输出 到 标准 输出 流 中 ， 
由 于 传递 给 putchar 函 数 的 参数 值 已 是 一 个 ASCII 码 ， 所 以 不 需要 对 它 做 “类 型 转换 ”。 例 如 ， 如 下 
几 行 putchar 函 数 的 代码 是 等 价 的 。 它 们 的 输出 结果 相同 ， 即 字符 “h”。putchar 和 其 他 函数 (如 自 
己 编写 的 函数 ) 没有 本 质 区 别 ， 调 用 方式 也 一 样 。 惟 一 不 同 的 是 ， 它 是 一 个 标准 库 函 数 (在 头 文 
件 stdio.hp 中 声明 )， 而 它 的 二 进 制 代码 也 是 在 程序 编译 的 链接 阶段 才 被 加 入 可 执行 代码 。 


char c = 'h'; 


|^ putchar(c); 
putchar('h'); 
putchar (104); 


18.3.3 getchar 函 数 


函数 getchar 与 LC-3 的 IN 指令 相似 。 该 函数 的 返回 值 ， 是 排 在 标准 输入 流 (stdin) 头 部 的 
ASCII 码 值 。 默 认 情况 下 ，stdin 对 应 键盘 设备 的 输入 流 。 如 下 代码 表示 的 是 ，getchar 返 加 的 是 下 一 
个 键盘 输入 字符 ASCII 码 值 )， 并 将 该 值 赋 给 变量 c。 

char c; 


c = getchar(); 


18.3.4 ”缓冲 1/O 


如 图 18-1 所 示 程 序 ， 如 果 运 行 一 遍 该 程序 ， 你 将 发 现 程序 的 人 笃 异 行为 。 程 序 提示 用 户 输入 一 
个 字符 并 等 待 ， 而 用 户 键入 一 个 字符 (如 “z”) 之 后 ， 却 发 现 第 二 个 提示 信息 始终 不 输出 
(getchar 函 数 似 乎 没有 被 执行 ) ? 但 是 ， 如 果 我 们 再 输入 一 个 回 车 键 ， 程 序 立刻 恢复 执行 ，getchar 
函数 存在 什么 问题 吗 ? 


#include <stdio.h> 





1 

2 

3 int main() 
4 { 

5 


char inCharl; 


图 18-1 Rihia AA RIAT 
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char inCbar2; 


printf ("Input character 1:\n"); 
inCharl = getchar(); 


printf("Input character 2: Mn"); 
inChar2 s getchar(); 


printf("Character 1 is &cXn", inCharl); 
printf("Character 2 is &cWMn", inChar2); 





图 18-1 缓冲 输入 的 例子 (HR) 


原因 是 键盘 输入 流 的 丝 冲 效应 。 几 平 所 有 的 系统 都 采用 缓冲 WO 机 制 ， 即 每 个 键盘 输入 都 先 被 操作 
系统 代码 捕获 ， 然 后 放 到 系统 内 部 的 一 个 缓冲 区 中 。 直 到 用 户 键入 回 车 健 ， 系 统 才 清 空 缓冲 区 ， 并 将 
缓冲 区 内 容 添加 到 输入 流 尾部 。 所 以 ， 图 18-1 所 示 程 序 中 ， 用 户 如 果 键 入 一 个 字符 (如 “A?)， 然 后 再 
键入 “ 回 车 符 ”"， 则 inChar1 的 内 容 为 “A”(ASCH 码 65)、inChar2 的 内 容 为 “ 回 车 符 ”(ASCH 码 10)。 

尽管 /0 缓冲 会 造成 以 上 “误解 *”， 但 它 却 是 非常 必要 的 ， 尤 其 是 用 键盘 输入 时 ， 按 下 回 车 键 ， 
可 让 用 户 确认 其 输入 。 在 有 缓冲 的 情况 下 ， 如 果 键 和 人 错误 字符 ， 用 户 可 以 通过 退 格 键 (backspace) 
或 删除 键 (del)“ 擦 除 ” 错 误 ， 然 后 重新 键入 ， 直 到 用 户 最 后 键入 回 车 键 。 

同样 ， 输 出 流 也 具备 类 似 的 缓冲 。 读 者 可 以 尝试 图 18-2 所 示 的 例子 ， 观 察 输 出 缓冲 时 的 表现 。 


#inciude <stdio.h> 
#include <unistd.h> 


int main() 


putchar('a'); 


四 om 证 wb 


Sleepí5); 


P 
e 


putchar ('b'); 
putchar('An') ; 


ee 
N m 





图 18-2 一 个 缓冲 输出 的 例子 


其 中 ， 该 程序 使 用 了 一 个 新 函数 sleep。sleep 的 作用 是 “暂停 ”程序 执行 ， 暂 停 时 间 由 sleep 的 
参数 指定 (单位 为 秒 )。 如 果 要 使 用 该 函数 ， 程 序 就 要 包含 头 文件 unistd.h。 程 序 运 行 时 发 现 ， 字 符 
“a” 没 有 立刻 输出 ， 而 是 经 过 大 约 $ 秒 后 ， 与 字符 b 同 时 输出 。 这 是 因为 ， 只 有 字符 “n” 能 清空 输 
出 缓冲 区 ， 将 字符 序列 添加 到 输出 流 中 。 我 们 可 以 尝试 在 第 6 行 代码 后 面 ， 加 入 一 行 
"putchar(n), ”语句 ， 然 后 观察 前 后 差别 。 

尽管 存在 细微 的 1/O 流 缓 溃 特性 ，putchar/getchar 的 底层 实现 机 制 其 实 就 是 第 8 章 中 描述 的 IN/ 
和 OUT TRAP 程 序 ， 流 的 缓 神 机 制 则 是 由 围绕 IN 和 OUT 服 务 程序 的 上 层 软件 实现 的 。 


18.4 格式 化 /MO 


Putchar 和 getchar 只 能 完成 简单 的 字符 MO 操作 ， 无 法 实现 “ 非 ASCH 码 ”数据 的 IO 操作 。 在 C 
标准 库 中 ， 函 数 printf 和 scanf 则 支持 各 种 数据 类 型 的 /JO， 以 及 更 高 级 的 格式 化 1/O 操 作 。 


18.4.1 printf 


printf 的 功能 是 将 格式 化 的 文本 输出 至 输出 流 中 。 通 过 printf 函 数 ， 我 们 可 以 将 程序 中 产生 的 各 
种 数值 ， 候 在 ASCII 文 本 中 ,混合 打印 输出 。 为 此 ，printf 必 须 具备 将 各 种 类 型 转换 为 ASCIH 码 的 能 
力 。 例 如 ， 如 下 代码 中 ， 为 打印 整数 变量 x，printf 必 须 将 整数 转换 为 ASCII 字 符 序列 ， 并 将 其 媒 入 
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在 整个 输出 字符 流 中 。 

printf("The value is $dWn", x); 

简单 地 说 ， 就 是 printf 将 它 的 第 一 个 参数 写 人 输出 流 。printf 的 第 一 个 参数 是 “格式 事 ” 
(format string) ， 它 的 类 型 是 字符 串 〈 即 类 型 char*) ， 包 含 的 内 容 是 要 输出 的 文本 ， 以 及 “转换 规 
范 ” (conversion specifications ) 。 

所 谓 “ 转 换 规范 ， 其 作用 是 指明 “格式 串 ” 之 后 各 参数 的 类 型 转换 方式 。 转 换 规范 以 符号 
“W%” 为 前 组 ,“%” 后 面 的 字符 代表 被 转换 的 数据 类 型 。 例 如 ， 我 们 已 列举 的 例子 中 曾 使 用 的 
“%d”， 它 表示 将 一 个 十 进 制 数 转 换 为 ASCII 码 字符 串 ， 再 如 ， 转 换 规范 “%x” 表 示 将 十 六 进 制 数 
转换 为 ASCII 码 字符 串 ,“%b” 表 示 被 转换 的 是 二 进 制 数 。 此 外 ， 还 有 诸如 %c、%s、%f 等 转换 规 = 
范 ，%c 代 表 ASCI 字 符 (char) ，%s 代 表 字 符 串 (string)，%f 代 表 浮 点 数 (float) 。 顺 便 问 个 问题 ， 
如 果 “%” 表 示 的 是 转换 规范 的 开始 ， 那 么 怎样 才能 输出 字符 “%” 本 身 昵 ?答案 是 “%%”。 可 和 参 
考 附 录 D 列 出 的 各 种 转换 规范 及 其 说 明 。 

在 第 11 章 中 ,我 们 曾 提 到 ， 格 式 串 中 还 可 以 包含 特殊 字符 ， 如 换行 符 “n”"。 特 殊 字符 的 前 缕 
是 “”"， 它 们 可 以 放 在 格式 串 的 任何 位 置 。 例 如 ，“\n” 代 表 换 行 符 (new line)，“x” 代 表 制 表 符 
(tab), WA, 如果“^” 代 表 特 殊 序 列 的 开始 ， 我 们 怎样 输出 字符 “\” 本 身 呢 ?答案 是 “\”。 可 
参考 附录 DD 中 表 D-1 的 各 种 特殊 字符 。 

如 下 是 各 种 格式 转换 规范 的 使 用 例子 : 

imt b 65. 

char c » 'z'; 

char banner[10] = "Hola!"; 

double pi - 3.14159; 

printf("The variable 'a' decimal : $dWMn", a); 

printf("The variable ʻa’ hex : $xMn", a); 

printf("The variable 'a' binary : $b\n", a); 

printf("'a' plus 'b' as character ; $cWMn", a + b); 

printf("Char $c.Xt String $s\n Float $fVWn", c, banner, pil; 

print£ AERA Tfi T Hz UB, amRIA BR RPRAE "76" we "UV. RREN HERRA 
出 流 中 (由 于 缓冲 ， 输 出 字符 直到 遇 到 换行 符 ， 才 显示 在 输出 设备 上 ) ， 如 果 当 前 字符 是 V, w 
将 下 一 个 字符 看 做 特殊 字符 ， 如 “\n” 表 示 换 行 ， 如 果 当 前 字符 是 “%”， 则 下 一 个 字符 表示 转换 
规范 。 例 如 ， 如 果 转 换 规范 为 “%d”， 且 其 对 应 参数 的 bit 值 是 “0000000001101000”， 则 读 bit 串 被 
转换 为 字符 串 “104”， 如 果 转 换 规 范 是 “%c”， 则 该 “bit 串 ”被 解释 为 字符 “h”， 转 换 规 范 如 
果 是 “%f”， 则 结果 又 将 不 同 (解析 过 程 有 些 复杂 ) 。 值 得 一 提 的 是 ， 转 换 规范 只 表示 如 何 解释 后 
续 参数 ， 而 与 后 续 参数 的 原本 类 型 没有 任何 关系 。 换 名 话说， 程序 员 可 以 选择 任何 解释 方式 。 思 
考题 : 如 下 代码 的 输出 结果 如 何 ? 

printf ("The value of nothing is $dWMn"); 

其 中 ,格式 串 中 包含 有 转换 规范 “%d”， 但 printf 没 有 提供 配对 的 后 续 参 数 。 函 数 执行 时 ， 
printf 将 认为 后 续 参数 已 被 放 人 执行 槛 中 。 所 以 ， 它 会 试图 从 栈 中 读 取 与 %d 相 应 的 数据 ， 然 后 将 转 
换 结 果 加 入 输出 流 。 但 事实 上 ， 我 们 并 未 在 栈 中 为 它 存放 数据 。 结 果 是 ，printf 从 楼 中 读 到 一 个 不 
确定 的 数值 ， 所 以 输出 结果 也 是 一 个 不 确定 的 十 进 制 数 。 


1 8.4.2 Scanf 


函数 scanf 的 作用 是 读 和 人 格式 化 的 输入 流 中 的 ASCII 数 据 。scanf 的 调用 方式 与 printf 相 似 ， 第 一 
个 参数 都 是 格式 所 (包含 解释 后 续 参 数 的 转换 规范 )， 之 后 的 参数 与 格式 申 中 的 转换 规范 一 一 对 应 。 
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不 同 之 处 是 ，scanf 中 后 续 参数 必须 是 指针 。 这 一 点 ， 我 们 在 第 16 章 曾 提 到 过 ， 因 为 scanf 要 为 这 些 
变量 赋值 ， 所 以 必须 将 变量 所 在 的 内 存 位置 〈 即 指针 ) 告诉 scanf。 

scanf 采 用 与 printf 相 同 的 格式 串 及 转换 规范 定义 ， 可 参考 附录 D 的 说 明 。 在 scanf 中 ， 转 换 规范 
代表 输入 流 数 据 (ASCII 码 ) 要 被 转换 的 目标 格式 。 例 如 ， 转 换 规 范 “%d”， 表 示 将 输入 流 中 的 下 
一 个 不 包含 “ 非 空 字符 ”( 注 ， 空格 、 回 车 都 是 “ 空 字 符 ”) 组 成 的 数字 序列 ， 转 换 成 一 个 十 进 制 
整数 。 按 照 这 个 转换 规范 所 示 ，scanf 从 输入 流 中 连续 读 取 一 串 十 进 制 数字 ， 然 后 将 转换 后 的 数值 
赋 给 对 应 参数 。 由 于 scanf 将 修改 参数 变量 的 值 ， 所 以 传递 的 是 变量 的 地 址 。 除 转换 规范 之 外 ， 格 
式 串 中 也 可 以 包含 普通 字符 ，scanf 将 它们 用 于 与 输入 流 匹配 。 如 下 所 示 是 scanf 的 使 用 例子 ， 


char name[100]; 
int month, day, year; 
double gpa; 


printf("Enter : lastname birthdate grade point averageMn"); 
scanf ("$s &d/t$d/*&d &1f", name, &month, &day, &year, &gpa); 


printf ("Mn"); 

printf("Name : $sMn", name); 

printf("Birthday : &d/5d/$àWn", month, day, year); 

printf("GPA : &fMn", gpa); 

其 中 ，scanf 的 第 一 个 转换 规范 “%s” 表 示 从 输入 流 读 取 -… 个 字符 早 。 在 输入 流 中 ， 它 对 应 的 
范围 是 第 一 个 非 空 字符 至 下 一 个 空 字符 之 间 的 字符 串 。 读 取 之 后 ，scanf 将 在 字符 串 最 后 ， 自 动 添 
加 字符 串 结束 符 “WO”， 然 后 将 结果 拷贝 至 字符 数组 name。 

第 二 个 转换 符 是 “%d”。 这 次 读 取 的 输入 流 范围 是 ， 自 下 一 个 非 空 字符 开始 的 一 个 连续 数字 字 
符 序 列 。 与 “%s” 不 同 的 是 ， 对 应 “%d ”的 字符 串 ， 最 后 不 需要 添加 结束 标志 ， 我 们 直接 将 这 个 
序列 转换 成 整数 ， 然 后 保存 在 变量 month 中 。 

随后 ， 过 到 字符 “/”"。 它 不 是 转换 规范 ， 所 以 不 需要 与 任何 变量 参数 匹配 ， 更 不 需要 为 任何 变 


量 赋值 。 所 以 ，scanf 从 输入 流 中 读 和 人 该 字符 后 ， 直 接 丢 弃 ， 然 后 继续 后 面 的 匹配 。 依 此 类 推 ， 是 
第 三 、 第 四 个 转换 规范 的 匹配 ， 匹 配 结果 分 别 保存 在 变量 day 和 year 中 。 注 意 ， 它 们 之 间 由 字符 “ 放 
分 隔 。 


最 后 一 个 转换 规范 是 “%lf”。 这 意味 着 scanf 将 输入 流 对 应 的 数字 序列 解释 为 一 个 双 精 度 浮 点 
数 ， 它 的 输入 格式 既 可 以 是 十 进 制 小 数 形式 ， 也 可 以 是 E 指 数 形式 的 科学 记 数 法 (参见 附录 D.2.4)。 
该 字段 以 一 个 非 数 字 字 符 (不 包括 第 一 个 E、 小 数 点 及 正 负 号 ) 或 空 字符 结束 。scanf 将 最 后 读 人 的 
序列 转换 为 浮 点 数 ， 然 后 保存 在 变量 gpa 中 。 

以 上 各 匹配 完成 之 后 ，scanf 返 回调 用 值 。scanf 的 返回 值 是 一 个 正 整 数 ， 代 表 已 被 正确 匹配 的 
个 数 。 如 在 本 例 中 ， 返 回 值 为 5。 

例如 ， 在 以 下 输入 时 ， 程 序 的 输出 为 : 


Enter : lastname birthdate grade point average 
Mudd 02/16/69 3.02 


Name : Mudd 
Birthday : 2/16/69 
GPA : 3.02 


如 果 输 入 如 下 所 示 ， 由 于 scanf 忽 略 空 字 符 (white space)， 因 此 输出 结果 不 变 : 


Enter : lastname birthdate grade point average 


Mudd 02 

/ 

16 / 69 3.02 
Name : Mudd 


Birthday : 2/16/69 
GPA : 3.02 
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试问 ， 如 果 输入 格式 与 scanf 指 定 的 格式 不 匹配 ， 结 果 会 如 何 呢 ? 例如 ; 


Enter : lastname birthdate grade point average 
Mudd 02 16 69 3.02 


其 中 ， 输 入 流 中 设 有 字符 “/”， 即 输入 流 格式 和 指定 格式 不 匹配 。 结 果 是 ，scanf 返 回 值 为 2 
( 即 成 功 匹 配 2 个 参数 )， 所 以 name 和 month 被 正确 赋值 ，day、year 和 gpa 则 失败 。 由 于 输入 流 是 被 
缓冲 的 ， 所 以 输入 流 中 的 字符 “”、“1”、“6” 等 并 未 被 丢弃 。 所 以 ， 如 果 我 们 继续 用 getchar 函 数 
读 取 输入 流 的 话 ， 还 可 以 将 它们 读 出 : 


a x getchar(}; 
b = getchar(); 


结果 是 , a=“”, b= "I", 


18.4.3 可 变 长 参数 


至 此 ， 你 可 能 发 现 函 数 printf 和 scanf 与 其 他 函数 有 些 不 太一 样 ， 即 它们 的 参数 个 数 不 确 定 。 
scanf 和 Printf 的 参数 个 数 ， 由 它们 的 第 一 个 参数 “格式 串 ” 决 定 。 我 们 称 这 种 函数 为 “可 变 长 参数 
H” (variable argument lists), 

在 这 种 函数 中 ， 格 式 串 中 的 转换 规范 与 之 后 参数 之 间 存 在 一 对 一 的 映射 关系 。 如 下 所 示 ， 

printf("Char $c.\t String $SNn Float $fAn", c, banner, pi); 

其 中 ， 格 式 串 中 包含 三 个 转换 规范 ， 与 此 对 应 ， 后 面 也 是 三 个 参数 。 转 换 规范 “%c” 对 应 变 
量 c，“%s” 对 应 变量 banner,“%f” 对 应 变量 Pi。 所 以 ， 我 们 说 传递 给 printf 的 参数 是 4 个 ， 打 印 输 
出 的 数目 是 3 个 。 如 果 打 印 输出 的 是 5 个 数值 ， 则 传递 给 printf 的 参数 数目 必然 是 6 个 。 

回顾 第 14 章 中 介绍 过 的 LC-3 参 数 传递 规范 ,参数 入 栈 的 顺序 是 自 右 向 左 。 在 printf 和 scanf 函 数 中 ， 
格式 捉 参 数位 于 最 左边 ， 所 以 它 最 后 入 栈 。 当 程序 执行 转 入 函数 时 ， 格 式 串 出 现在 栈 硕 ， 所 以 通过 
栈 顶 格式 串 内 容 的 分 析 ， 就 可 以 推算 出 栈 内 参数 的 个 数 和 类 型 。 而 如 果 函 数 参数 传递 顺序 是 从 左 到 
右 ， 则 格式 串 的 分 析 过 程 就 非常 困难 。 图 18-3 所 示 是 printf 执 行 时 的 栈 情 况 ， 图 (a) 表示 自 右 向 左 的 
参数 传递 方式 ， 图 (b) 表示 的 则 是 自 左 向 右 的 传递 方式 。 在 图 (a) 中 ， 无 论 参数 个 数 是 多 少 ， 格 
式 串 所 在 的 酚 偏 移 始终 为 0， 而 在 图 (b) 中 ， 格 式 串 的 偏 移 难以 确定 ， 它 与 参数 个 数 密切 相关 。 

另外 ， 格 式 串 是 一 个 字符 串 常 量 ， 与 其 他 嵌 在 代码 中 的 字符 串 常 量 一 样 ， 它 们 位 于 系统 中 的 一 
个 特殊 内 存 空间 (全 局 数据 区 )， 即 专门 用 于 存放 常量 (constant) 或 文本 值 (literal value) 的 空间 。 


printf ("$d Sa sd\n", x, y, Z); 





前 一 个 函数 的 活动 
记录 空间 






a) 自 右 向 左 的 人 材 方式 b) 自 左 向 右 的 人 栈 方式 
图 18-3 入 栈 方 式 
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18.5 文件 UVO 


在 处 理 大 批量 数据 的 情况 下 ， 比 如 统计 20 年 以 来 IBM 公 司 股票 的 日 收盘 价格 。 显 然 ， 通 过 手 
工 输入 这 些 数据 是 不 现实 的 〈 让 用 户 键盘 输入 “这 么 多 ”数据 ， 是 非常 “不 友好 的 ”(user- 
unfriendly))。 此 时 ， 就 需要 文件 WO 方式 。 数 据 存放 在 磁盘 文件 中 ， 而 处 理 结果 也 将 写 入 文件 。 如 
前 所 述 ，C 的 WO 是 面向 流 的 ， 现 在 要 做 的 事情 是 ， 怎 样 将 流 与 特定 文件 相关 联 。 

事实 上 ， 前 面 所 介绍 的 printf 和 scanf 函 数 ， 只 是 许多 通用 C WO 函数 中 的 特例 。 换 旬 话 说 ， 它 们 
操作 的 只 是 两 个 特殊 文件 stdin 和 stdout。 而 在 C 语 言 中 ， 文 件 stdin 代 表 的 是 键盘 设备 ，stdout 代 表 的 
是 显示 器 设备 。 

更 通用 版 本 的 printf 和 scanf 函 数 是 fprint 和 fscanf。 它 们 的 用 法 与 printfyscanf 相 似 。 不 同 的 是 ， 
在 printf 和 scanf 中 ， 默 认 的 关联 文件 分 别 是 stdout 和 stdin， 而 在 印 rintft 和 fscanf 中 ， 关 联 文件 要 由 程 
序 员 显 式 给 出 。 例 如 ， 我 们 可 以 指定 fprintf 将 输出 内 容 写 入 指定 的 文件 中 。 下 面 ， 我 们 将 介绍 文件 
WO 的 操作 机 制 。 

首先 ， 在 文件 IO 之 前 ， 我 们 需要 声明 一 个 文件 指针 。 如 下 所 示 ， 假 设 我 们 声明 一 个 名 为 infile 
的 文件 指针 : 


FILE *infile; 

其 中 ， 类 型 FILE 是 在 stdioh 头 文件 中 定义 的 一 个 数据 类 型 。 有 关 FILE 的 详细 信息 ， 已 超出 本 
书 讲述 范畴 ， 故 不 再 展开 。 

之 后 ， 我 们 将 该 文件 指针 与 特定 的 磁盘 文件 相关 联 。 关 联 操作 通过 fopen 函 数 实现 。 如 下 所 示 ， 
fopen 国 数 有 两 个 参数 ， 一 是 文件 名 ， 二 是 文件 操作 类 型 说 明 。 

FILE *infile; 

infile = fopen("ibm stock prices", "r"); 

其 中 ， 第 一 个 参数 是 文件 名 “ibm_stock_prices”， 第 二 个 参数 是 我 们 将 对 该 文件 采用 的 操作 模 
XX (mode)。 模 式 有 很 多 类 ， 如 “r” 代 表 只 读 (read-only) ，“w” 代 表 写 (write)。 如 果 以 这 种 
模式 打开 ， 则 文件 的 原 内 容 将 丢失 ，“a” 代 表 文 件 附加 (append)。 即 文件 原 内 容 不 变 ， 新 数据 
附加 在 文件 结尾 ，“r+” 代 表 可 读 可 写 。 

国 数 fopen 的 调用 如 果 成 功 ， 则 返回 一 个 文件 指针 ， 否 则 ， 函 数 返回 一 个 空 指针 。 所 以 ， 程 序 
员 应 该 培养 好 习 人 符 ， 每 次 调用 fopen 后 ， 都 应 该 检查 返回 值 即 文件 指针 是 否 为 空 。 如 下 面 代码 所 示 ;: 

FILE *infile; 

infile = fopen("ibm stock prices", "r"); 


if (infile == NULL) 
printf("fopen unsuccessful!Wn"); 


此 时 ， 函 数 fopen 的 成 功 返 回 ， 意 味 着 文件 指针 已 与 一 个 物理 文件 有 效 “ 有 映射 "。 基 于 该 文件 指 
针 ， 我 们 就 可 以 通过 fscanf 和 fprintf 函 数 读 、 写 文件 了 ， 这 与 我 们 通过 scanf 和 print 函 数 读 写 标准 设备 
的 方法 一 样 。 如 图 18-4 所 示 ，fscanf 和 fprintf 的 第 一 个 参数 都 是 FILE * 类 型 ， 指 示 函 数 所 要 操作 的 流 。 

这 里 ， 程 序 读 取 的 是 一 个 名 为 “ibm_stock_prices” 的 ASCII 文 本 文件 ， 写 的 是 一 个 名 为 
“buy_hold_or_sell” 的 文件 。 从 代码 中 ， 我 们 可 以 看 出 ， 文 件 ibm_stock_prices 和 包含 的 是 一 组 浮 点 
数据 ， 且 浮 点 数 之 间 由 空格 分 隔 。 尽 管 该 数据 文件 可 能 很 长 ， 但 该 程序 最 多 只 读 入 (scanf) 10000 
个 数据 项 。 如 果 文 件 中 不 再 有 数据 了 ， 则 fscanf 会 返回 一 个 特殊 值 。 所 以 ， 代 码 中 会 特地 检查 这 个 
返回 值 ( 预 处 理 器 将 这 个 值 定义 为 宕 EOF) 。while 循 环 的 终止 条 件 是 ; 遇 到 EOF (End-Of-File) 字 
符 ， 或 读 入 字符 的 数目 已 超过 极限 值 (10000)。 当 文件 内 容 被 全 部 读 入 后 (prices[] 数 组 )， 程 序 将 
对 它们 做 出 运算 处 理 (程序 中 省 略 的 部 分 ) ， 最 后 再 将 处 理 结果 (answer 串 ) 写 入 文件 。 
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如 果 fprintf 的 第 一 个 参数 为 stddout， 则 与 printf 完 全 等 价 。 同 样 ， 如 果 fscanf 的 第 一 个 参数 为 
stdin， 则 | 与 scanf 完 全 等 价 。 


#include <stdio.h> 
#define LIMIT 10000 


int main() 


FILE *infile; 

FILE *outfile; 

double prices[LIMIT] ; 
char answer[í10]; 

int i - 0; 


infile = fopen("ibm stock prices", "r"); 
nyn) ; 


outfile = fopen("buy hold or sell", 
if (infile 1= NULL && outfile {= NULL) ( 
/* Read the input data */ 
while ((fscanf(infile, "$1f", &prices(il) != EOF) && i < LIMIT) 
i++; . 


printf("*d prices read from the data file", i); 


/* Process the data... */ 


/* Write the output */ 
fprintf(outfile, "s", answer); 


else { 
printf("fopen unsuccessful!WMn"); 





图 18-4 文件 IO 的 一 个 例子 


18.6 小 结 


本 章 的 主题 是 C 的 IO 接口 使 用 。 与 其 他 语言 一 样 ，C 本 身 并 不 提供 IO 能 力 。 相 反 ， 它 们 是 由 

函数 库 提 供给 用 户 调用 的 。 而 这 些 IO ， 最 终 是 由 底层 IN/OUT 指 令 来 完成 的 。 

本 章 的 关键 内 容 是 : 

。 输入 /输出 流 。 几 平 所 有 的 现代 语言 ， 都 对 1/O 进 行 了 抽象 ， 于 是 形成 这 样 的 操作 规范 ， 输 
入 /输出 的 对 象 是 “ 流 ”， 生 产 者 (producer) 将 数据 写 入 流 的 尾部 ， 而 消费 者 (consumer) 
从 流 的 头 部 读 取 数 据 。 生 产 者 和 消费 者 之 间 ， 各 自 做 自己 的 事情 ， 无 需 相互 等 待 ， 也 不 必 协 
商 设 备 的 互 斥 访问 问题 。 例 如 ， 程 序 如 果 向 显示 器 输出 数据 ， 它 所 要 做 的 事情 只 是 将 数据 写 
到 输出 流 即 可 ， 而 不 必 在 每 次 写 人 之 前 ， 都 确认 输出 设备 是 否 空闲 。 

。 四 个 基本 LI/O 函 数 。 本 章 非常 详细 地 讨论 了 C 语 言 中 4 个 基本 IO 函数 的 操作 机 制 ， putchar、 
getchar、printft、scanf。 其 中 ， 后 面 两 个 是 变 长 参数 函数 。LC-3 的 参数 传递 规范 ， 能 够 很 容易 
地 处 理 不 定 长 的 参数 数目 ， 因 为 它 的 参数 入 栈 顺 序 是 自 右 向 左 的 。 请 回顾 一 下 其 中 的 道理 。 

。 文件 IO。 在 C 语 言 中 ， 所 有 的 “IO 流 ” 都 属于 “文件 MO” 方 式 。 国 数 printf 和 scanf 也 不 例 
外 ， 只 是 在 printft 和 scanf 中 ， 软 认 的 IO 文件 是 标准 输出 和 标准 输入 设备 而 已 。 通 用 的 文件 
IO 函数 是 : fprintf 和 fscanf。 在 这 两 个 函数 中 ， 第 一 个 参数 指定 了 操作 的 文件 指针 。 该 文件 
指针 通过 fopen 函 数 与 一 个 物理 文件 相关 联 (bind)。 
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18.7 习题 


18.1 


18.2 
18.3 
18.4 
18.5 


18.6 


18.7 


18.8 


18.9 


试 调用 W/O 函数 完成 以 下 任务 。 所 有 任务 每 次 只 能 调用 -一 次 WO 函数 。 

a. 在 屏幕 上 ， 依 次 打印 一 个 整数 、 一 个 字符 串 和 一 个 浮 点 数 ， 

b. 在 屏幕 上 ， 打 印 输出 格式 如 “(XXX) -XXX-XXXX” 的 电话 号 码 。 提 示 : 电话 号 码 包括 
区 号 、 交 换 局 号 、 端 号 等 三 部 分 ， 分 别 由 三 个 整数 变量 表示 ， 

c. 在 屏幕 上 上， 打印 输 出 格式 如 “XXX-XX-XXXX” 的 学 生 ID， 每 个 ID 段 是 一 个 长 度 为 3 的 字 
TR, 

d. 以 格式 “XXX-XX-XXXX” 的 方式 ， 从 键盘 读 人 学 生 ID ， 每 个 IDP 字 段 分 别 存 放 在 三 个 整 
数 中 ， 

e. 从 键盘 读 和 一连串 的 个 人 信息 ,其 中 包括 姓名 、 年 龄 、 性 别 等 字段 。 字 段 之 间 由 逗号 分 隔 。 
其 中 ， 姓 名 和 性 别 存 储 为 字符 串 格 式 ， 年 龄 为 整数 。 

试 间 ， 函 数 scanf 的 返回 值 代表 什 么 含义 ? 

试问 ， 为 什么 要 对 键盘 输入 流 进行 缓冲 ? 

试问 ， 从 一 个 内 容 为 空 的 输入 流 中 读 取 数据 ， 结 果 会 如 何 ? 

运行 如 下 代码 ， 会 打印 输出 奇怪 的 数据 (An: 1073741824) ， 请 解释 其 中 原因 。 


float x = 192.27163; 
printf ("The value of x is %d\n", x); 


运行 如 下 人 代码。 试问 ， 输 入 字符 串 “This is not the input you are looking for” 之 后 ，input 的 
值 是 什么 ? 
scanf("*d", &input); 
阅读 如 下 代码 ， 回 答 问 题 : 
#include <stdio.h> 
int main () 
int x = 0; 
int y = 0; 
char label[10]; 
scanf ("$d $d", &x, &y); 
scanfí("$s", label); 


printf("$d $d $sWn", x, y, label); 


a. 如 果 输 入 为 “46 29 BlueMoon”， 程 序 运行 结果 如 何 ? 

b. 如 果 输 入 为 “46 BlueMoon”， 程 序 运行 结果 如 何 ? 

c. 如 果 输 入 为 “111 999 888”， 程 序 运行 结果 如 何 ? 

试 编写 程序 ， 这 个 程序 读 和 人 一 个 “C 语 言 的 源 代码 文件 ”。 要 求 ， 程 序 能 删除 源 文 件 中 的 空 
格 ， 并 将 去 除 空格 后 的 文件 内 容 写 和 人 另 一 个 文件 中 (文件 名 设 定 为 “condensed_program” )。 
试 编写 程序 ， 该 程序 以 一 个 文本 文件 为 输入 ， 并 完成 以 下 计数 : 

a. 文件 中 字符 串 的 个 数 。 所 谓 “ 字 符 串 ”"， 头 部 为 一 个 空 字 符 ， 结 尾 处 也 是 一 个 空格 ， 

b. 文件 中 英文 单词 的 个 数 。 所 谓 “ 英 文 单词 "， 以 字母 a~z 或 A~Z 开 头 ， 以 任意 非 字母 字符 结束 ， 
c. 文件 中 惟一 出 现 的 英文 单词 的 个 数 。 所 谓 “ 英 文 单词 "， 参 考 问 题 b 的 定义 。 所 谓 “ 惟 一 ”， 
表示 该 单词 在 文件 中 出 现 且 仅 出 现 一 次 ; 

d. 统计 文件 中 英文 单词 出 现 的 频 度 ， 并 按照 频 度 的 高 低 ， 有 序 输 出 这 些 单词 及 其 频 度 。 换 句 
话说 ， 就 是 扫描 该 文本 文件 ， 记 录 文 件 中 出 现 的 每 一 个 单词 ， 并 记录 它 已 出 现 的 次 数 ， 最 后 ， 
将 这 些 单词 按照 它们 出 现 次 数 的 大 小 ， 依 次 (从 大 到 小 ) 打印 输出 这 些 单词 及 其 出 现 的 次 数 。 


第 19 章 数据 结构 


19.1 概述 


C 语 言 的 核心 中 ， 只 支持 三 种 基本 数据 类 型 : 整数 、 字 符 和 浮 点 数 9。 这 意味 着 ，C 本 身 支 持 
这 些 类 型 变量 的 内 存 分 配 ， 及 其 与 类 型 相关 的 运算 符 ， 如 加 法 运算 符 “+” 和 乘法 运算 符 “*” 等 。 
随 着 我 们 对 本 书 第 二 部 分 内 容 的 学 习 ， 体 会 到 了 扩展 基本 类 型 的 必要 性 ， 如 指针 (pointer) 和 数 
组 (array) 等 扩展 类 型 的 引入 。 指 针 和 数组 类 型 源 于 三 种 基本 类 型 。 例 如 ， 指 针 可 指向 三 种 基本 
类 型 中 的 任何 一 种 类 型 的 变量 ， 类 似 地 ， 我 们 也 可 以 将 数组 声明 为 int、char 或 double。 

编程 者 的 任务 是 ， 编 写 能 够 解决 实际 问题 的 程序 。 其 中 ， 关 注 的 对 象 包括 飞机 机 可、 人 和 群 或 
迁徙 中 的 针 鱼 。 问 题 是 ， 底 层 的 计算 机 硬件 只 能 处 理 如 整数 、 字 符 或 浮 点 数 等 数据 类 型 。 所 以 ， 
程序 员 必 须 设法 解决 现实 对 象 和 基本 数据 类 型 之 间 的 映射 问题 ， 这 是 个 繁重 的 任务 。 编 程 语言 的 
任务 之 一 ， 就 是 在 两 者 之 间 进 行 沟通 。 提 供 对 现实 对 象 的 描述 能 力 ， 并 为 之 定义 操作 方法 ， 是 而 
向 对 象 方法 的 两 个 基础 任务 。 . 

所 谓 “ 面 向 对 象 的 编程 ”， 就 是 让 程序 设计 围绕 着 “对 象 ”展开 (而 不 是 围绕 计算 机 硬件 所 能 
提供 的 基本 数据 类 型 ) ， 这 就 是 面向 对 象 编程 的 核心 法 则 。 本 章 我 们 要 做 的 是 ， 朝 着 “面向 对 象 ” 
走 很 小 的 一 步 ， 即 学 习 怎 样 基 于 多 种 基础 数据 类 型 构建 新 的 数据 类 型 。 在 C 语 言 中 ， 我 们 称 这 种 聚 
合 方式 为 “结构 体 ”(structure)。 结 构 体 的 作用 是 方便 对 象 的 描述 ， 一 个 结构 体 (或 对 象 ) 中 可 以 
包含 不 止 一 个 数值 。 例 如 ， 在 一 个 企业 数据 库 程 序 中 ， 将 一 个 “员工 ”(employee) 对 象 表示 为 
“结构 体 ”"”， 则 包含 ， 姓 名 (字符 串 )、 职 位 (字符 串 )、 部 门 (可 能 是 整数 )、 工 号 (整数 ) 等 数据 。 
所 以 ， 在 设计 这 样 的 数据 库 系 统 时 ， 我 们 完全 有 理由 使 用 C 结 构 体 。 

本 章 的 主题 是 C 语 言 的 高 级 数据 结构 。 首 先 我 们 将 介绍 ， 在 C 程 序 中 如 何 创建 结构 体 变量 ， 以 
及 如 何 创建 结构 体 数 组 ， 然后， 是 C 中 的 动态 内 存 分 配 。 虽 然 动态 内 存 分 配 与 数据 结构 之 间 不 存在 
必然 联系 ， 但 是 后 面 的 链表 结构 中 ， 将 涉及 有 关 概 念 。 最 后 一 项 内 容 是 “链表 ”(linked list), 'E 
也 是 一 种 非常 基础 和 常用 的 数据 组 织 方式 。 该 结构 和 数组 很 相似 ， 都 是 存储 一 组 数据 。 不 同 之 处 
在 于 数据 的 组 织 形式 不 同 。 我 们 还 将 介绍 链表 的 几 种 基本 操作 : 添加 、 删 除 和 查找 。 


19.2 结构 体 


对 于 许多 事物 来 说 ， 最 好 的 描述 方法 是 多 个 基本 类 型 的 聚合 。 针 对 这 些 对 象 ，C 语 言 提供 “ 结 
构 体 ”的 概念 。 通 过 “结构 体 ” 方 法 ， 程 序 员 可 以 随时 定义 新 的 数据 类 型 ， 它 可 以 包含 多 个 数据 
项 ， 且 这 些 数据 项 的 类 型 可 以 是 int、char 或 double， 甚 至 可 以 是 这 些 基本 类 型 的 指针 或 数组 。 结 构 
体 变 量 的 声明 方式 ， 与 基本 类 型 变量 的 声明 方式 相同 。 只 是 在 任何 结构 体 变 量 被 声明 之 前 ， 该 结 
构 体 的 组 织 结构 及 其 各 成 员 的 类 型 、 命 名 等 ， 都 必须 事先 定义 。 

下 面 ， 我 们 以 飞机 航班 的 描述 为 例 (在 飞行 模拟 器 或 航空 管理 等 程序 中 需要 )。 首 先 ， 我 们 要 
确定 与 应 用 程序 相关 的 一 些 飞机 属性 ， 如 : 航班 号 ， 用 来 识别 飞机 的 身份 ， 通 常 由 数字 或 字符 的 
序列 表示 ， 另 外 ， 飞 行 高 度 、 经 纬度 、 航 向 等 属性 也 很 重要 ， 它 们 可 以 表示 为 整数 ， 再 就 是 ， 飞 


O H3 (enumeration) 也 是 一 种 基本 类 型 ， 但 与 整数 类 型 非常 接近 。 
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行 速度 ， 可 以 表示 为 浮 点 数 。 于 是 ， 一 个 航班 就 可 以 表述 为 以 下 变量 的 集合 : 


char flightNum(7]; /* Max 6 characters */ 
int altitude; /* in meters */ 
int longitude; /* in tenths of degrees */ 
int latitude; /* in tenths of degrees */ 
int heading; /* in tenths of degrees */ 
double airspeed; /* in kilometers/hour */ 


如 果 程 序 需 要 同时 描述 多 个 航班 飞机 ， 则 可 以 为 每 个 航班 拷贝 一 份 上 面 的 代码 (适当 修改 变 
车 名 即 可 )， 但 这 样 的 代码 将 显得 非常 元 长 。 如 果 采 用 C 语 言 提供 的 struct 结 构 体 ， 则 可 以 将 所 有 这 
些 属性 聚合 成 一 个 类 型 ， 如 下 所 示 : 


struct flightType { y 


Char flightNum(7]; /* Max 6 characters 

int altitude; /* in meters */ 

int longitude; /* in tenths of degrees */ 

int latitude; /* in tenths of degrees */ 

int heading; /* in tenths of degrees */ 
in kilometers/hour */ 


double airSpeed; /* 


通过 以 上 声明 ， 我 们 定义 了 一 种 新 的 数据 类 型 。 它 包括 6 个 成 员 (member), HO, DEBERI] 
并 未 为 它 申请 空间 ， 只 是 告诉 编译 器 有 这 样 一 种 新 的 数据 类 型 ， 它 的 类 型 名 称 是 “flightType”， 以 
及 它 的 成 员 组 成 。 

为 这 个 新 类 型 声明 一 个 变量 的 方法 ， 如 下 所 示 : 

struct flightType plane; 

该 语句 声明 了 一 个 变量 plane。 事 实 上 ， 该 变量 本 身 包含 了 6 个 数据 项 。 除 此 之 外 ， 结 构 体 变量 
的 各 种 使 用 方法 与 传统 变量 没有 什么 区 别 。 

对 结构 体 变量 内 部 成 员 项 的 访问 方式 ， 如 下 面 代码 所 示 : 

struct flightType plane; 


plane.airSpeed = 800.00; 
plane.altitude = 10000; 


其 中 ， 对 每 个 成 员 的 访问 〈 读 或 写 ) ， 标 识 方式 是 
“变量 名 ”， 然 后 是 连接 符 “.”， 然 后 是 “成 员 名 ”。 

如 果 plane 是 局 部 变量 ， 则 它 的 分 配 空间 是 在 “ 栈 ” 
中 ， 且 是 一 段 足 够 大 的 连续 空间 (以 存放 下 所 有 的 成 员 )。 
如 在 上 面 例子 中 ， 由 于 每 个 基本 类 型 占用 一 个 内 存单 元 ， 
所 以 变量 plane 占 用 的 空间 总 大 小 是 12 个 内 存单 元 。 

结构 体 变量 的 空间 分 配 并 没有 什么 特殊 之 处 。 结 构 
体 变量 的 空间 分 配 与 基本 类 型 相同 ， 局 部 变量 分 配 在 栈 
空间 中 ， 全 局 变量 分 配 在 全 局 数据 空间 中 。 图 19-1 所 示 是 


运行 时 栈 空间 












plane.flightNum[0] 






plane.flightNum[1] 






plane.flightNum(2] 






plane.flightNum[3] 






plane.flightNum[4] 






plane.flightNum[5] 







如 下 声明 代码 对 应 的 栈 使 用 情况 : plane.flightNum[6) 
int x; plane.altitude 
Struct airplaneType plane; 
int y; plane.longitude 







结构 体 声 明 的 语法 格式 如 下 所 示 : plane.latitude 

struct tag ( 
typel memberl; 
type2 member2; 


'plane.heading 







plane.airSpeed 


typeN memberN 
identifiers; 


其 中 ，“tag” 代 表 特 定 “ 结 构 体 "， 它 只 是 一 个 标识 ， 图 19-1 结构 体 变量 在 栈 空间 的 占用 情形 


— 
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为 以 后 的 代码 引用 提供 了 一 个 “ 抓 取 ”该 结构 体 的 “句柄 ”(handie) ; 成员 列表 (member), M 
定义 了 该 结构 体 的 组 织 方式 。 从 语法 上 讲 ， 就 是 一 组 声明 。 每 个 成 员 的 类 型 是 任意 的 ， 甚 至 可 以 
是 一 个 “结构 体 ” 类 型 ， 最 后 ， 是 “标识 ”(identifier) ， 它 们 是 可 选项 ， 代 表 的 是 为 该 结构 体 类 型 
声明 的 一 个 或 多 个 变量 。 注 意 ， 这 些 变量 “标识 ”的 位 置 是 夹 在 “}” 和 “， ”之 间 的 。 


19.2.1 typedef 


如 果 说 “结构 体 ” 为 程序 员 提 供 了 一 种 任意 创建 新 数据 类 型 的 机 制 ， 那 么 ，typedef 则 提供 了 
一 种 为 已 有 数据 类 型 重新 命名 的 机 制 。typedef 语 名 的 形式 如 下 所 示 ， 

typedef type name; 

该 语句 的 作用 是 ,为 已 有 数据 类 型 type 创 建 了 一 个 别名 name。 其 中 ，type 既 可 以 是 一 个 基本 数 
据 类 型 ， 也 可 以 是 由 程序 员 创 建 的 数据 类 型 (An. 结构 体 ) 。 例 如 ， 


typedef int Color; 

其 中 ，Color 仅 仅 是 int 的 一 个 别名 。 换 句 话 说， 代码 中 出 现 的 Color， 都 可 以 直接 替换 为 int， 
反之 亦 然 。 这 样 ， 我 们 就 可 以 使 用 Color 来 定义 变量 了 。 例 如 ， 我 们 可 以 这 样 定义 位 图 像素 : 

Color pixels[500]; 


同样 ，typedef 还 可 用 于 程序 员 自 定义 的 数据 类 型 。 例 如 ， 我 们 将 之 前 定义 的 结构 体 flightType 


命名 为 Flight: 
struct flightType { 
Char flightNum[7]; /* Max 6 characters */ 
int altitude; /* in meters */f 
int longitude; /* in tenths of degrees */ 
int latitude; /* in tenths of degrees */ 
int heading; /* in tenths of degrees */ 
double airSpeed; /* in kilometers/hour */ 


typedef struct flightType Flight; 

在 语法 上 ，Flight 和 struct flightType 完 全 等 价 。 例 如 ， 我 们 可 以 使 用 Flight 声 明 结 构 体 变量 
plane: | 

Flight plane; 

该 变量 声明 语句 ， 与 之 前 的 “struct flightType plane” 声 明 语句 完全 等 价 。 

除 此 之 外 ，typedef 并 没有 更 多 的 作用 。C3 引 入 typedef 的 目的 ， 就 是 使 代码 更 具 可 读 性 ， 尤 其 是 
在 程序 中 自 定义 数据 类 型 较 多 的 情况 下 。 为 数据 类 型 选 一 个 好 名 字 ， 使 得 该 数据 类 型 的 含义 更 加 
明确 (这 与 好 的 变量 名 的 作用 相同 )。 


19.2.2. 结构 体 在 C 中 的 实现 


前 面 ， 我 们 介绍 了 结构 体 的 声明 和 变量 分 配 技术 ， 我 们 的 关注 点 是 其 成 员 字段 的 访问 和 运算 
操作 ， 以 及 通过 typedef 来 自 定 义 数 据 类 型 。 我 们 将 继续 介绍 如 何 操作 结构 体 的 成 员 ， 例 如 ， 如 下 
代码 是 对 类 型 为 Flight 的 变量 的 altitude 成 员 的 访问 操作 : 

Fliqui plane; 

int Y: 


plane.altitude - 0; 


其 中 ，plane 是 一 个 Flight 类 型 的 变量 。 由 Flight 结 构 体 的 定义 可 知 ，plane 包 含 6 个 成 员 。 对 其 
成 员 altitade 的 访问 方法 是 ， 在 变量 名 后 加 操作 符 “.”， 然 后 是 成 员 名 。 编 译 器 事先 知道 该 结构 体 的 
布局 。 所 以 ， 通 过 一 定 的 偏 黎 ， 即 可 找到 变量 的 某 个 成 员 。 如 图 19-1 所 示 ， 编 译 器 在 符号 表 中 ， 记 
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录 每 个 变量 相对 基地 址 (RS) 的 偏 移 量 。 而 如 果 该 变量 是 结构 体 类 型 ， 符 号 表 中 还 将 记录 每 个 成 
员 在 结构 体 变 量 中 的 偏 移 。 例 如 , “plane.altitude = 0，” 语 句 ， 编 译 器 要 访问 的 对 象 是 ， 栈 中 第 2 
个 变量 的 第 2 个 成 员 。 

如 下 所 示 是 LC-3 编 译 器 为 该 语句 (plane.altitude = 0, ) 生成 的 汇编 代码 : 


AND R1, R1, #0 ; zero out R1 
ADD RO, R5, H-12 ; RO contains base address of plane 
STR R1, RO, #7 ; plane.altitude = O0; 


假设 我 们 要 写 一 段 代 码 ， 判 断 芝加哥 上 空 是 否 存在 飞机 相 撞 的 可 能 。 编 写 中 ， 我 们 使 用 了 结 
构 体 Flight， 并 假设 同一 时 刻 ， 芝 加 哥 上 空 最 多 有 100 架 飞机 。 那 么 ， 我 们 可 以 声明 一 个 数组 ， 

Flight planes[100]; 

该 声明 与 简单 声明 (如 int d[100], ) 完全 相似 。 只 是 ， 后 者 声明 的 是 100 个 整数 ， 而 此 处 声 
明 的 是 100 个 结构 体 (每 个 结构 体 又 包含 6 个 成 员 )。 例 如 ，plane[12] 代 表 的 是 ， 内 存 中 100 个 结构 
体 中 的 第 13 个 结构 体 。 每 个 结构 体 的 单元 空间 大 小 应 足够 保存 它 的 6 个 成 员 。 

在 该 数组 中 ， 每 个 数组 元 素 的 类 型 都 是 Flight， 且 可 以 按照 标准 的 数组 方式 来 访问 。 例 如 ， 要 
访问 第 一 个 飞机 的 属性 ， 则 用 planes[0] 即 可 。 而 如 果 要 访问 其 中 的 成 员 ， 则 加 上 后 缕 成 员 名 即 可 。 
例如 ， 访 间 第 一 个 飞机 的 航向 信息 ， 则 为 planes{0j.heading 即 可 。 如 下 所 示 是 计算 所 有 飞机 的 平均 
速度 的 代码 : 

double sum - 0; 


double averageAirSpeed; 


for (i = 0; i < 100; i++) 
sum = sum + plane[i].airSpeed; 


averageAirSpeed - sum / 100; 

此 外 ， 我 们 还 可 以 创建 指向 结构 体 的 指针 。 如 下 所 示 定 义 的 指针 ， 包 含 的 是 一 个 类 型 为 Flight 
的 结构 体 变 量 所 在 的 地 址 : 

Flight *planePtr; 

结构 体 指针 的 赋值 操作 ， 与 其 他 指针 变量 相同 。 

planePtr = &plane[34]; 

如 果 我 们 要 访问 该 指针 变量 所 指向 的 结构 体 变 量 的 成 员 ， 可 采用 如 下 表示 方式 ， 

(*planePtr).longitude 

其 中 ， 做 了 一 个 变量 planePtr 的 “间接 引用 ”(dereference) 操作 。 它 指向 的 是 类 型 为 Flight 的 
对 象 ， 如 果 对 它 做 闻 接 引用 ， 则 访问 的 就 是 一 个 类 型 为 Flight 的 对 象 。 对 其 成 员 的 访问 ， 则 通过 符 
号 “.” 实 现 。 我 们 在 后 面 会 看 到 ， 通 过 指针 引用 一 个 结构 体 是 个 非常 常用 的 操作 。 但 由 于 该 表示 
方法 的 非 直观 性 ， 我 们 专门 为 此 操作 定义 了 一 个 运算 符 。 于 是 ， 上 面 的 表达 式 等 价 为 如 下 表达 式 : 

planePtr-»longitude 

在 此 ， 表 达 式 “->” 等 价 于 间接 引用 符 “*”。 不 同 之 处 在 于 ，“*” 可 以 用 于 任何 类 型 的 指针 ， 
而 “->” 仅 限于 对 结构 体 中 成 员 的 引用 。 

下 面 ， 我 们 将 之 前 有 关 结 构 体 的 讨论 实际 应 用 起 来 。 要 求解 的 实际 例子 是 ， 通 过 对 100 架 飞机 
的 状态 分 析 ， 检 测 它们 之 间 存 在 磁 撞 危险 的 可 能 性 。 为 此 ， 我 们 要 对 每 架 飞 机 的 高 度 、 经 度 、 纬 
度 及 航向 都 做 分 析 ， 才 能 判断 出 相互 碰撞 的 可 能 。 如 图 19-2 所 示 ， 在 函数 PotentialCollisions 中 ， 通 
过 调用 Collide 判 断 飞机 航道 之 间 是 否 存在 交叉 (本 例 中 的 代码 是 不 完整 的 ， 我 们 将 它 作为 练习 ， 
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留 给 读者 。 请 写 出 更 精确 的 、 判 断 两 机 航道 之 间 是 否 存在 交叉 的 代码 )。 

值得 一 提 的 是 ，PotentialCollisions 传 递 给 Collide 的 两 个 参数 是 两 个 指针 (而 不 是 结构 体 )。 吕 
然 直接 传递 结构 体 也 是 可 行 的 ， 但 传递 指针 的 效率 更 高 。 因 为 ， 在 传递 指针 的 方式 下 ， 只 需要 将 
两 个 指针 压 入 栈 中 (而 不 必 压 入 两 个 Flight 结 构 体 即 24 个 内 存单 元 )。 


#include «stdio.h» 
#define TOTAL FLIGHTS 100 








/* Structure definition */ 


struct flightType { 
char flightNum[7];  /* Max 6 characters 


Q -J Oc Ut « à N dL. 






int altitude; /* in meters */ 

int longitude; /* in tenths of degrees */ 

9 int latitude; /* in tenths of degrees */ 
10 int heading; /* in tenths of degrees */ 
11 double airSpeed; /* in kilometers/hour */ 





H 


typedef struct flightType Flight; 







int Collide(Flight *planeA, Flight *planeB); void 
PotentialCollisions(Flight planes[]): 








int Collide(Flight *planeA, Flight *planeB) 









{ 


/** More logic to detect collision goes here **/ 


if (planeA-»altitude -- planeB-»altitude) 







24 ) 
25 else 
26 return 0; 






} 


void PotentialCollisions(Flight planes[}) 
30 { 

31 int i; 
int j; 







for (i = 0; i < TOTAL FLIGHTS; i++) { 

35 for (j = 0; j < TOTAL FLIGHTS; j++) { 
36 if (Collide(&planes[i], &pianes[j])) 
37 printf("Flights $s and %s are on collision course! Mn", 
planes[il.flightNum, planes[j].flightNum); 







图 19-2 基于 Flight 结构 体 的 一 个 例子 


19.4 动态 内 存 分 配 


在 C 程 序 中 ， 内 存 对 象 (如 变量 ) 在 内 存 中 的 分 配点 只 有 三 个 可 能 ， 栈 、 人 多 局 数据 区 或 准 
(heap) 。 局 部 变量 的 默认 分 配 空间 是 栈 ， 全 局 变量 的 分 配 空间 是 全 局 数据 区 ， 该 区 间 由 程序 所 有 
模块 访问 ， 动 态 数据 对 象 (程序 运行 时 创建 的 ) 的 分 配 空间 则 是 堆 。 

在 前 一 个 例子 中 ， 我 们 声明 了 一 个 能 包含 100 个 Flight 结 构 体 的 数组 。 但 是 ， 如 果 我 们 要 求 程 
序 能 处 理 变 化 数目 的 飞机 ， 或 2 个 ， 或 20 000 个 ， 应 该 怎样 为 这 些 数据 分 配 空间 呢 ? 显然 ， 我 们 必 
须 按 最 大 数目 为 之 分 配 空 间 ， 即 声明 一 个 能 包含 20 000 个 Flight 结 构 体 的 数组 。 但 问题 是 ， 通 常情 
况 下 ， 飞 机 数目 远 小 于 20 000， 所 以 存在 着 内 存 空间 的 浪费 。 另 一 个 极端 则 是 ， 飞 机 数目 如 果 超 过 
20 000 个 ， 则 程序 崩溃 。 较 好 的 处 理 方法 应 该 是 ， 根 据 当前 飞机 数目 ， 动 态 分 配 存 销 数据 的 空间 。 
为 此 ， 引 入 了 “动态 内 存 分 配 ” 的 概念 。 | 

所 谓 “ 动 态 内 存 分 配 "， 原 理 如 下 :在 系统 中 ， 有 一 个 被 称 做 “内 存 分 配器 ”(allocator) 的 程 
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È, 管理 着 一 个 被 称 做 “ 堆 ”(heap) 的 内 存 空 间 。 如 图 19-3 所 示 (这 是 图 12-7 的 拷贝 )， 它 描述 的 
是 内 存 中 ， 各 区 段 CIE HEU) 之 间 的 关系 。 在 执行 oo 
过 程 中 ， 程 序 可 以 请 求 内 存 分 配器 ， 申 请 一 段 大 小 确定 
的 连续 内 存 。 于 是 ， 分 配器 将 这 段 空间 预 留 下 来 ， 并 将 











该 段 空间 的 起 始 地 址 (指针 ) 返回 给 申请 者 。 例如, 我。 | i. 
们 可 以 向 分 配器 申请 一 段 能 存储 1000 个 Flight 结 构 体 的 程序 代码 [o 
内 存 空间 。 如 果 堆 中 剩余 的 空间 足够 ， 则 分 配器 返回 指 gem 
向 该 地 址 的 指针 。 注 意 ， 在 图 19-3 中 ， 堆 和 栈 是 “ 头 对 ILS LLLI | 
头 ”增长 的 。 栈 的 大 小 取决 于 函数 调用 的 深度 ， 而 堆 的 ”内 存 空间 ) | 
大 小 则 取决 于 分 配器 接受 的 “分 配 申请 ”数目 。 | | | 
顺便 提 一 下 ， 在 堆 中 已 被 分 配 的 内 存 空 间 将 永久 保 | Y 
留 ， 直 到 程序 主动 释放 。“ 内 存 回 收 器 ”(deallocator) | | 
的 任务 , 就 是 接收 程序 的 释放 请 求 , 并 将 该 空间 “归还 ” | | 
A R7 i | | 
给 堆 ， 供 下 次 申请 使 用 。 I——— reat 
动态 大 小 的 数组 运行 时 的 栈 空间 


在 C 语 言 中 ， 动态 内 存 分 配 由 一 个 C 标 准 库 负 责 。 
例如 ， 激 活 分 配器 的 函数 是 malloc， 参 见 如 下 代码 , E 
malloc 的 使 用 方法 : 图 19-3 “ 堆 ” 在 LC-3 内 存 空间 中 的 位 置 





int airbornePlanes; 
Flight *planes; 


printf("How many planes are in the air?"); 
scanf {"%d", &airbornePlanes); 


planes = malloc(24 * airbornePlanes); 


其 中 ，malloc 的 任务 是 ， 在 堆 中 分 配 一 段 连续 内 存 空间 ， 该 空间 的 大 小 如 malloc 的 参数 所 指定 。 
如 果 分 配 成 功 ， 则 malloc 返 回 一 个 指向 该 空间 的 指针 。 

在 此 ， 分配 大 小 为 “24*airbornePlanes” 个 字 节 ，airbornePlanes 代 表 飞 机 数目 ， 那 么 24 代 表 什 
么 ?答案 是 ， 它 代表 Flight 结 构 体 的 大 小 ， 即 6 个 成 员 的 大 小 总 和 “1 个 字符 数组 (14)、4 个 整数 
(8)、1 个 双 精 度 浮 点 数 (2) ) 。 因 为 ， 在 LC-3 中 ， 每 单元 大 小 为 2 个 字 节 ， 所 以 该 结构 体 大 小 为 
“2* (7+4+1) = 24” 个 字 节 。 显 然 ， 程 序 员 必须 小 心计 算 每 个 结构 体 的 大 小 ， 这 无 疑 降低 了 代码 
的 可 读 性 。 为 此 ，C 语 言 又 引入 了 操作 符 sizeof。sizeof 的 作用 是 返回 其 参数 (一 个 内 存 对 象 或 类 型 ) 
所 占 空间 的 大 小 (单位 为 字 节 )。 例 如 ，sizeof(Flight) 的 返回 值 ， 是 结构 体 Flight 的 大 小 ( 即 24)。 
有 了 sizeof， 程 序 员 可 以 不 必 计 算 各 种 数据 对 象 的 大 小 ， 事实 上 ， 计 算 工 作 将 由 编译 器 完成 。 

如 果 malloc 申 请 内 存 时 ， 堆 的 所 有 空间 都 已 被 分 配 ， 则 malloc 返 回 NULL。 符 号 NULL 是 一 个 
预 处 理 宏 ， 代 表 空 指针 ， 它 的 具体 值 是 多 少 取决 于 不 同 的 系统 。 因 此 ， 检 查 malloc 的 返回 值 ， 对 程 
序 员 来 说 是 个 好 习惯 。 

malloc 的 返回 值 是 一 个 指针 变量 。 但 该 指针 的 类 型 是 什么 呢 ? 例如 ， 在 前 面 的 例子 中 ， 我 们 将 
malloc 返 回 的 指针 看 做 是 Flight 类 型 的 指针 。 如 果 我 们 为 int 型 数组 申请 空间 ， 则 malloc 的 返回 值 应 
该 被 看 做 是 int 指 针 。 为 了 支持 各 种 类 型 的 内 存 分 配 ，malloc 函 数 的 返回 值 采 用 通用 指针 类 型 ( 即 
void *) ， 而 该 返回 值 在 使 用 时 要 做 “强制 类 型 转换 ”(type cast) 。 换 句 话 说， 无 论 什么 情况 下 调用 
malloc， 我 们 都 需要 告诉 编译 器 ， 将 返回 值 转换 为 合适 的 类 型 (而 不 是 默认 的 void * ) 。 

例如 ， 在 前 一 个 例子 中 ， 我 们 就 将 malloc 的 返回 指针 转换 为 另 一 种 类 型 。 其 中 ， 我 们 为 指针 
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planes 指 定 的 类 型 是 Flight * ， 则 我 们 实际 上 是 强制 地 将 malloc 返 回 的 void * 类 型 转换 为 了 Flight * 类 
型 。 当 然 ， 这 多 少 造 成 了 一 定 的 移植 性 方面 的 问题 。 所 以 ， 大 多 数 编译 器 会 为 此 输出 一 个 警告 信 
息 ， 告 诉 我 们 “程序 正在 将 一 种 类 型 的 指针 值 赋 给 另 一 种 类 型 的 指针 变量 ”"。 类 型 转换 使 得 编译 器 
要 将 一 种 类 型 的 变量 当做 另 一 种 类 型 的 变量 来 处 理 。 对 一 个 数值 做 类 型 转换 的 语法 如 下 所 示 (将 
某 一 种 类 型 数值 转换 为 newType 类 型 ) : 


var = (newType) expression; 


有 关 类 型 转换 的 细节 ， 可 参考 附录 D.5.11 。 
了 解 了 类 型 转换 、sizeof 以 及 错误 检查 的 必要 性 之 后 ， 我 们 将 本 节 前 面 的 代码 重新 修改 如 下 ， 


int airbornePlanes; 
Flight *planes; 


printfí"How many planes are in the air?"); 
scanf("td", &airbornePlanes); 


/* A more correctly written call malloc */ 
planes = (Flight +} malloc(sizeof(Flight) * airbornePlanes); 


if (planes -- NULL) ( 
printf("Error in allocating the planes arrayWM"); 


piane[0].altitude = ... 

其 中 ， 由 于 malloc 所 分 配 的 空间 在 地 址 上 是 连续 的 ， 所 以 指针 方式 或 数组 方式 都 是 通用 的 。 例 
如 ， 在 如 上 代码 中 ， 我 们 可 以 使 用 planes[29] 的 表达 方式 ， 访 问 第 30 个 结构 体 (当然 ， 前 提 是 
airbornePlanes 必 须 大 于 30)。 这 是 C 语 言 的 一 个 重要 特性 ， 即 指针 和 数组 可 以 交替 互 换 。 也 因为 这 种 
灵活 性 ，C 语 言 成 为 最 受 欢 迎 的 编程 语言 。 其 他 由 C 而 派生 的 语言 (如 C++)， 也 都 继承 了 这 个 特性 。 

malloc 只 是 众多 动态 内 存 分 配 国 数 之 一 。 其 他 函数 ， 如 calloc， 不 仅 分 配 内 存 空间 ， 同 时 还 将 
该 空间 内 容 初 始 化 为 0， 再 如 ，realloc 能 够 尝试 着 去 扩大 或 缩小 已 分 配 内 存 空间 的 大 小 。 如 果 要 使 
用 这 类 内 存 分 配 函 数 ， 程 序 中 必须 包含 头 文件 “stdlib.h”。 你 能 否 使 用 realloc 来 创建 随 数据 大 小 而 
改变 大 小 的 数组 ? 例如 ， 写 一 个 函数 AddPlane(0) ， 当 已 有 planes 数 组 的 空间 太 小 时 ， 调 用 该 函数 增 
加 planes 的 空间 ;， 反之， 让 函数 DeletePlane0 缩 减 当 前 planes 的 空间 。 

与 内 存 分 配水 数 对 应 的 是 内 存 释 放 函 数 。 该 函数 的 名 称 是 free， 参 数 是 指针 ， 指 向 被 malloc 
(或 calloc、realloc) 分 配 的 内 存 块 。 一 个 内 存 区 域 一 旦 被 释放 ， 可 再 次 被 分 配 。 为 什么 一 定 需 要 释 
HARR? 答案 是 ， 程 序 运行 时 ， 总 有 一 些 数 据 结构 在 不 断 地 增长 、 缩 减 。 对 于 缩减 操作 ， 我 们 
需要 将 它们 的 内 存 空 间 归 还 到 堆 空 间 ， 以 备 以 后 的 分 配 使 用 。 


19.5 链表 


在 讨论 了 结构 体 和 动态 内 存 分 配 概念 之 后 ， 我 们 将 介绍 计算 机 中 最 重要 的 (也 是 无 处 不 在 的 ) 
一 个 数据 结构 一 一 链表 (linked list)。 链 表 和 数组 相似 ， 都 用 于 存储 那些 表示 为 元 素数 列 的 数据 。 
不 同 之 处 是 ， 在 数组 中 ， 一 个 元 素 ( 除 最 后 一 个 ) 与 其 下 一 个 元 素 ， 在 内 存 空间 中 也 是 连续 的 ;而 在 
链表 中 ， 每 个 元 素 也 有 其 “下 一 个 ”"， 但 它们 之 间 不 要 求 在 内 存 空 间 上 是 连续 的 。 

我 们 称 链表 中 的 每 个 元 素 为 “节点 ”(node)。 每 个 节点 是 一 个 “单位 ”(unit) 数据 ， 如 上 一 
节 中 ,每 个 航班 的 所 有 属性 信息 的 集合 就 是 一 个 数据 “单位 ”。 在 链表 中 ， 节 点 之 间 通 过 指针 互相 
连接 。 每 个 节点 中 ， 包 含 一 个 指向 下 一 节点 的 指针 。 换 句 话 说， 给 定 一 个 起 始 节点 ， 我 们 就 可 以 
通过 指针 ， 从 一 个 节点 “ 跳 ” 到 下 一 个 节点 ， 直 至 遍历 整个 链表 。 如 果 要 创建 这 些 节点 ， 则 要 用 
到 C 结 构 体 。 在 这 个 描述 节点 的 结构 体 中 ， 关 键 的 一 个 元 素 就 是 指向 下 一 节点 的 指针 。 在 如 下 代码 
中 ， 我 们 将 介绍 一 下 链表 的 使 用 方法 。 其 中 ， 节 点 结构 体 借助 于 原 有 的 Flight 结 构 体 。 注 意 ， 我 们 
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对 它 做 了 一 个 修改 ， 即 在 结构 体 中 添加 了 一 个 新 成 员 ， 一 个 指向 同类 型 结构 体 的 指针 。 


typedef struct flightType Flight; 
struct flightType ( 


char flightNum(7]; /* Max 6 characters */ 
int altitude; /* in meters */ 
int longitude; /* in tenths of degrees */ 
int latitude; /* in tenths of degrees */ 
int heading; /* in tenths of degrees */ 
double airSpeed; /* in kilometers/hour */ 


Flight *next; 
F: 
与 数组 类 似 ， 链 表 也 是 有 头 有 尾 。 链 表 的 头 (head) 节点 ， 由 一 个 “ 头 指 针 ” (head pointer) 
来 指向 它 。 而 链表 的 尾 (tail) 节点 ， 其 指针 则 指向 NULL。 图 19-4 所 示 是 链表 的 两 种 表示 方法 。 
一 个 是 链表 的 逻辑 表示 法 ， 每 个 节点 表示 为 一 个 小 方块 ， 指 针 则 表示 为 箭头 ， 另 一 个 则 是 链表 的 


物理 表示 法 ， 即 链表 在 内 存 中 的 数据 结构 。 


链表 的 抽象 表示 





NULL 


链表 在 内 存 中 的 组 织 方式 





图 19-4 链表 的 两 种 表示 方法 


尽管 链表 和 数组 存在 太 多 的 相似 ,但 它们 之 间 存 在 本 质 上 的 差异 。 数 组 的 访问 顺序 是 “随机 的 ” 
(random)。 例 如 ， 我 们 可 以 先 访问 数组 的 第 4 个 元 素 ， 然 后 是 第 911 个 ， 然 后 又 是 第 45 个 。 相 比 之 下 ， 
链表 的 每 次 访问 都 必须 从 “ 头 ” 开 始 。 例 如 ， 要 访问 第 29 个 节点 ， 则 必须 先 从 第 0 个 节点 〈 头 节点 ) 
开始 ， 然 后 是 第 1 个 节点 、 第 2 个 节点 …… 最 后 到 达 第 29 个 节点 。 但 是 ， 链 表 具 有 较 好 的 动态 特性 ， 如 
在 链表 中 ， 添 加 或 删除 节点 时 无 需 移动 其 他 节点 。 而 在 数组 中 ， 每 添加 或 删除 一 个 元 素 ， 都 需要 更 多 
的 操作 (特别 是 被 操作 元 素 位 于 数组 中 间 时 )。 例 如 ， 在 19.3 节 的 航班 管理 程序 中 ， 当 一 个 飞机 着 陆 
后 ,程序 可 以 删除 该 飞机 的 信息 ， 应 该 怎么 做 呢 ? 如果 是 在 链表 方式 中 ， 我 们 可 以 将 不 需要 的 信息 直 
接 删 除 ( 即 链表 的 对 应 节点 )， 空 间 的 分 配 (为 刚 起 飞 的 飞机 ) 和 回收 (已 着 陆 的 飞机 ) 都 很 方便 。 


示例 
假设 我 们 要 设计 一 个 “汽车 交易 库存 销售 系统 ”软件 。 在 交易 市 场 ， 车 子 不 停 地 进 或 出 ， 数 
据 库 信息 也 因此 而 不 断 地 刷新 一 一 新 车 进来 时 , 添加 新 数据 项 ， 车 子 卖 出 时 ,删除 该 数据 项 。 此 外 ， 
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这 些 数 据 项 应 该 按 车 牌号 顺序 存储 ， 以 方便 销售 人 员 (为 了 买 家 ) 快速 查询 车 辆 信息 。 在 数据 库 
中 ， 我 们 为 每 辆 车 定义 了 如 下 的 记录 信息 : 


int vehicleID; /* Unique identifier for a car */ 
char make[20]; /* Manufacturer */ 
char model[20]; /* Model name */ 
int year; /* Year of manufacture */ 
int mileage; /* in miles */ 
double cost; /* in dollars */ 
Car *next; /* Points to a car node */ 


为 简化 起 见 ， 我 们 将 车 牌号 定义 为 int 类 型 (实际 的 牌号 应 该 是 字符 和 数字 的 组 合 ， 而 不 是 
EUR). 

对 管理 程序 而 言 ， 最 常见 的 操作 就 是 数据 项 的 添加 、 删 除 和 查找 。 如 果 采 用 “链表 ”这 种 数 
据 结构 ， 这 些 操作 应 该 非常 简单 、 快 捷 。 链 表 中 ， 每 个 节点 代表 交易 场 的 一 辆 汽车 。 为 此 ， 我 们 
定义 了 这 样 一 种 节点 结构 体 ， 并 使 用 typedef 将 其 命名 为 CarNode. 

typedef struct carType Car; 


struct carType { 


int vehicleID; /* Unique identifier for a car */ 
char make[20]; /* Manufacturer */ 
char model[20]; /* Model name */ 
int year; /* Year of manufacture */ 
int mileage; /* in miles */ 
double cost; /* in dollars */ 
Car *next; /* Points to a car node */ 


h 

其 中 ， 指 针 next 指 向 一 个 同类 型 的 结构 体 对 象 ， 即 在 程序 中 ， 它 代表 链表 的 下 一 个 节点 。 如 果 
某 节 点 的 next 值 等 于 NULL， 则 意味 着 该 节点 为 链表 的 结尾 。 
int main() 


{ 
*/ 


int op = 0; /* Current operation to be performed. 
Car carBase; /* carBase an empty head node */ 


carBase.next - NULL; /* Initialize the list to empty  */ 
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printf ("=========================\n")} 
printf ("=== Used car database ---Mn"); 
printf(" =\n\n"); 


wo 


Pp 
H o 


while (op != 4) { 
printf ("Enter an operation:\n"); 
printf ("1 - Car aquired. Add a new entry for it.\n"); 
printf ("2 - Car sold. Remove its entry.\n"); 
printf("3 - Query. Look up a car's information.WMn"); 
printf ("4 - Quit.\n"); 
scanf("t&d", &op); 


em 
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18 
19 
20 


if (op -- 1) 
AddEntry (&carBase); 
else if (op == 2) 
DeleteEntry (&carBase); 
else if (op == 3) 
Search(&carBase); 
else if (op == 4) 
printf ("Goodbye.\n\n"); 
else 
printf("Invalid option. Try again.WXnWMn"); 
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图 19-5 FERE maini 
在 确定 了 数据 类 型 的 定义 及 其 内 存 组 织 方 式 之 后 ， 我 们 开始 程序 执行 流程 的 设计 。 图 19-5 所 
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示 是 主 程序 main 国 数 的 代码 。 

在 图 19-5 的 代码 中 ， 我 们 设计 了 一 个 “菜单 ”(menu) 类 型 的 数据 库 使 用 接口 。 在 程序 中 ， 主 
要 的 数据 结构 体 都 包含 在 变量 carBase 中 ， 它 的 类 型 是 CarNode RIZA "E" (dummy) 头 节 
点 。 因 为 ，carBase 节 点 中 不 包含 任何 数据 信息 ， 它 的 作用 只 是 为 了 挂 接 链 表 。 采 用 哑 节 点 的 好 处 
是 方便 了 链表 的 添加 、 删 除 算法 ， 因 为 不 需要 考虑 链表 为 空 的 情况 。 初 始 条 件 下，carBase.next 设 
置 为 NULL， 代 表 数 据 库 ( 即 链表 ) 中 不 包含 任何 数据 。 值 得 注意 的 是 ， 在 调用 链表 的 添加 
(AddEntry)、 删 除 (DeleteEntry)、 查 找 (Search) 等 函数 时 ， 和 传递 的 参数 都 是 carBase 的 地 址 。 

我 们 还 将 发 现 ， 函 数 AddEntry、DeleteEntry 和 Search 都 要 做 一 个 操作 ， 必 须 扫 描 链 表 ， 才 能 定 
位 节点 。 例 如 ， 在 添加 节点 操作 中 ， 我 们 必须 知道 插 在 什么 位 置 。 由 于 链表 是 有 序 排列 的 ( 按 车 
牌 ID)， 所 以 新 节点 的 位 置 是 ; 保证 所 有 ID 值 大 于 该 节点 IP 的 节点 都 在 该 节点 之 后 。 为 查找 该 位 置 ， 
我 们 编写 了 ScanList 函 数 。 该 函数 的 任务 是 从 链表 头 “headPointer”( 参 数 1) 开始 扫描 各 节点 ， 查 
HEIDE *vehicleID" (参数 2) 匹配 的 节点 。 如 果 找 到 世 匹 配 节 点 ， 则 ScanList 函 数 返 回 指向 该 节点 
之 前 一 个 节点 的 指针 ， 如 果 不 存在 ID 匹配 节点 ， 则 返回 指向 最 后 一 个 不 大 于 “searchID” 节 点 的 指 
针 。 顺 便 问 一 下 ， 为 什么 是 指向 前 一 个 节点 昵 ?答案 是 ， 只 有 这 样 ， 随 后 的 添加 或 删除 操作 才 更 
方便 ， 参 见 图 19-6 所 示人 代码。 

Car *ScanList(Car *headPointer, int searchID) 


Car *previous; 
Car *current; 


/* Point to start of list */ 
previous - headPointer; 
current - headPointer-»next; 


/* Traverse list -- scan unti! we find a node with a 
/* vehicleID greater than or equal to searchID 
while ((current != NULL) && 
(current-»vehicleID < searchID)) { 
previous - current; 
Current = current-»next; 


/* The variable previous points to node prior to the 
/* node being searched for. Either current-»vehicleID 
/* equals searchID or the node does not exist. 

return previous; 





图 19-6 查找 ID 匹配 节点 的 函数 


下 面 ， 我 们 开始 编写 节点 添加 函数 AddEntry。 该 函数 的 任务 是 ， 读 取 用 户 输入 的 新 车 信息 ， 
并 在 链表 中 添加 一 个 包含 这 些 信息 的 节点 。 如 图 19-7 代 码 所 示 ， 在 AddEntry 函 数 中 ， 首 先 调 用 
malloc 函 数 ， 在 堆 区 段 分 配 一 个 CarNode 大 小 的 空间 (如 果 分 配 失 败 ， 程 序 将 打印 出 错 信息 ， 并 调 
用 exit 函 数 结束 程序 的 执行 )。 然 后 ， 提 示 用 户 输入 新 车 信息 ， 并 将 这 些 信 息 存储 在 CarNode 成 员 变 
量 中 。 随 后 ， 是 添加 操作 。 通 过 ScanList 函 数 查 找 新 节点 的 插入 位 置 (如 果 该 节点 已 经 存在 于 链表 
中 ， 则 打印 出 错 信息 ， 并 调用 free 函 数 释 放 新 节点 的 空间 )。 

图 19-8 所 示 是 将 节点 插入 链表 的 详细 示意 图 。 一 旦 通过 ScanList 查 找到 合适 的 插入 点 
(prevNode)， 则 将 prevNode 的 next 修 改 为 指向 新 节点 (newNode) ， 同 时， 将 新 节点 的 next 指 向 下 
一 个 节点 (nextNode)。 图 中 还 给 出 了 链表 为 空 时 ， 节 点 插入 的 情况 。 此 时 ， 由 于 prevNode 指 向 的 


是 空 的 头 节 点 ， 所 以 只 需 将 头 节点 的 next 指 向 新 节点 (newNode) 即 可 。 
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void AddEntry(Car *headPointer) 
{ 

Car *newNode; /* Points to the new car info */ 
Car *nextNode; /* Points to car to follow new one */ 
Car *prevNode; /* Points to car before this one 



















/* Dynamically allocate memory for this new entry. 
newNode = (Car *) malloc (sizeof (Car)); 






if (newNode == NULL) { 
11 printf("Error: could not allocate a new node\n"); 
12 exit(1); 


) 


printf ("Enter the following info about the car. Xn"); 
16 printf ("Separate each field by white space: Wn"); 
printf("vehicle id make model year mileage cost(n"); 












scanf ("%d $s %s td $d %1f", 
20 &newNode-»vehicleID, newNode-»make, newNode-»model, 
21 &newNode-»year, &newNode-»mileage, &newNode-»cost); 









prevNode = ScanList (headPointer, newNode-»vehicleID); 
24 nextNode - prevNode-»next; 


if ((nextNode -- NULL) || 
27 (nextNode-»vehicleID != newNode-»vehicleID)) ( 
28 prevNode-»next - newNode; 
29 newNode-»next - nextNode; 
printf ("Entry added.\n\n"); 






















else ( 







33 printf ("That car already exists in the database!WMn"); 
34 printf ("Entry not added. \n\n"); 
35 free (newNode) ; 







} 
} 





图 19-7 数据 库 添加 数据 项 (新 节点 ) 的 函数 
在 链表 中 插入 新 节点 


prevNode | "peso ， 





nextNode 


在 空 链表 中 插入 新 节点 





nextNode 


图 19-8 在 链表 中 添加 新 节点 。 虚 线 表示 新 生成 的 链 
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删除 链表 节点 的 过 程 ， 与 AddEntry 非 常 相似 。 首 先 ， 用 户 输入 要 删除 节点 的 车 牌 ID， 然 后 ， 
通过 ScanList 定 位 节点 位 置 ， 如 果 发 现 该 ID 节点 ， 则 删除 该 节点 。 图 19-9 所 示 是 删除 操作 的 代码 。 
值得 注意 的 是 ， 一 旦 节点 被 删除 ， 就 能 调用 free 函 数 将 空间 归还 给 堆 区 段 。 图 19-10 所 示 是 删除 节 


点 的 示意 图 。 


void DeleteEntry (Car *headPointer) 


{ 
int vehicleID; 
Car *delNode; /* Points to node to delete 
Car *prevNode; /* Points to node prior to delNode 


printf("Enter the vehicle ID of the car to delete: Mn"); 
scanf ("%d", &vehicleID); 


oO -Jo0Ur» 6€ tNBÁ| 


prevNode - ScanList(headPointer, vehicleID); 


delNode = prevNode-»next; 


/* Bither the car does not exist or */ 
/* delNode points to the car to be deleted. */ 
if (delNode !- NULL && delNode-»vehicleID -- vehicleID) ( 
prevNode-»next - delNode-»next; 
printf ("Vehicle with ID &d deleted.\n\n", vehicleID); 
free (delNode); 


else 
printf ("The vehicle was not found in the databaseMn"); 





图 19-9 删除 节点 的 函数 


prevNode 





delNode 


图 19-10 从 链表 中 删除 一 个 节点 ， 虚 线 表 示 新 生成 的 链 


在 此 ， 我 们 将 链表 和 数组 的 添加 、 删 除 方法 做 个 有 趣 的 比较 。 在 链表 中 ， 一 旦 找到 节点 位 置 ， 
添加 或 删除 节点 的 操作 仅 限 于 修改 几 个 指针 即 可 。 而 在 数组 方式 下 ， 删 除 某 个 元 素 ， 意 味 着 必须 
将 之 后 的 所 有 元 素 全 部 前 移 一 步 ， 以 维护 数组 的 顺序 性 和 连续 性 。 如 果 数 组 长 度 非常 大 ， 则 数据 
移动 的 开销 是 惊人 的 。 结 论 是 ， 从 添加 和 删除 操作 来 看 ， 链 表 方式 优 于 数组 方式 。 

最 后 ， 我 们 编写 数据 库 的 查找 函数 Search。 它 和 AddEntry、DelEntry 非 常 相 似 ， 只 是 它 不 需要 
修改 链表 。 如 图 19-11 所 示 ， 该 函数 通过 ScanList 函 数 ， 定 位 被 查询 节点 。 


void Search(CarNode *headPointer) 


H 


int vehicleID; 
CarNode *searchNode; /* Points to node to delete to follow */ 
CarNode *prevNode; /* Points to car before one to delete */ 


printf("Enter the vehicle ID number of the car to search for:Mn"); 
scanf ("%d", &vehicleID); 


prevNode = ScanList(headPointer, vehicleID); 
searchNode = prevNode-»next; 


图 19-11 查询 函数 


2 
3 
4 
5 
6 
7 
8 
9 
0 
1 


|o 
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searchNode = prevNode-»next; 


/* Either the car does not exist in the list or 

/* searchNode points to the car we are looking for. 

if (searchNode !- NULL && searchNode-»vehicleID == vehicleID) 
printf ("vehicle ID : %d\n", searchNode-»vehicleID); 
printf ("make : $sWMn", searchNode- make); 
printf ("model : $s\n", searchNode- »model); 
printf("year : $d\n", searchNode-»year); 
printf ("mileage : d\n", searchNode-»mileage); 


/* The following printf has a field width specification on 
tf specification. The 10.2 indicates that the floating 
point number should be printed in a 10 character field 
with two units after the decimal displayed. 
printf ("cost : $%10.2f\n\n", searchNode-»cost); 
} 
else { 
printf ("The vehicle ID %d was not found in the database.\n\n", 
vehicieID); 





图 19-11 查询 函数 (HX) 


19.6 小 结 


本 章 内 容 可 以 总 结 为 以 下 三 个 重要 概念 : 

C 结 构 体 。 本 章 最 重要 的 目标 ， 就 是 介绍 “结构 体 ”(structure) 的 概念 。 它 为 程序 员 创 建新 
的 数据 类 型 提供 了 一 种 机 制 。 在 C 语 言 中 ， 程 序 员 通过 “结构 体 ”"， 可 以 将 多 种 类 型 元 素 组 
合成 一 个 新 类 型 。“ 结 构 体 ”体现 了 面向 对 象 的 编程 思想 ， 即 将 编程 重心 围绕 在 真实 世界 的 
对 象 之 上 ， 而 不 是 计算 机 硬件 所 支持 的 几 种 基本 类 型 。 

动态 内 存 分 配 。 动 态 内 存 分 配 的 概念 ， 是 高 级 C 编 程 的 一 个 基础 。 在 程序 执行 过 程 中 ， 我 们 
需要 一 种 内 存 分 配 机 制 ， 以 支持 动态 数据 对 象 对 内 存 增 长 和 缩减 的 需求 。 为 此 ，C 提 供 了 如 
malloc、calloc、realloc 和 free 等 内 存 分 配 和 回收 国 数 。 

链表 。 将 结构 体 和 动态 内 存 分 配 这 两 个 概念 结合 ， 我 们 引入 了 计算 机 系统 中 最 重要 的 一 个 
数据 结构 一 一 链表 (linked list) 。 它 与 数组 的 相似 之 处 是 ， 都 适用 于 “数列 ”(list) 的 组 织 
管理 。 链 表 结 构 之 所 以 这 么 重要 ， 是 因为 它 的 动态 特性 。 链 表 大 小 可 以 在 执行 过 程 中 ， 动 态 
增长 和 减 小 。 这 种 特性 是 数组 类 型 所 不 具备 的 (在 一 些 情况 下 ， 数 组 存在 空间 浪费 的 问题 )。 
链表 的 关键 是 ， 数 据 项 之 间 通 过 指针 相连 。 以 后 在 更 高 级 的 数据 结构 ， 如 哈 希 表 (hash 
table)、 树 (tree) 或 图 (graph) 中 ， 你 还 将 看 到 链表 的 身影 。 





19.7 习题 


19.1 


试问 ， 以 下 程序 是 否 存在 bug? 请 解释 。 


struct node { 
int count; 
struct node *next; 


h 
int main() 


int data - 0; 
Struct node *getdata; 


getdata-»count = data + 1; 
printf("$d", getdata-»count); 
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192 ”如 下 是 一 个 C 程 序 的 部 分 代码 : 
struct node f 


int count; 
struct node *next; 


main() 


int data = 0; 
Struct node *getdata; 


getdata - getdata-»next; 


} 
请 写 出 编译 器 为 其 中 的 “getdata = getdata->next， ”语句 所 生成 的 LC-3 汇 编 代码 。 

19.3 如 图 19-2 所 示 ， 在 PotentialCollisions 函 数 中 ， 有 一 段 配对 检查 代码 ， 判 断 某 架 飞 机 与 其 他 所 
有 飞机 之 间 是 否 存在 相 撞 的 可 能 。 如 果 将 这 段 代码 稍 做 修改 , 即 可 大 大 提高 程序 执行 的 效率 。 
请 问 如 何 修改 ? 

19.4 如 果 在 一 个 计算 机 系统 中 ， 每 一 种 基本 数据 类 型 (指针 、 字 符 、 整 数 、 浮 点 数 ) 都 只 占用 一 
个 内 存单 元 。 试 回答 以 下 编译 问题 。 
5， 


int atomic number; 
float atomic mass; 


is it noble(struct element tí(], int i) 
if ((t[il.atomic number--2) || 
(t[il.atomic number--10) || 
(t[il.atomic number--18) || 
(t[il.atomic number--36) || 
(t[ij.atomic number--s54) || 
(t(il.atomic number--«86)) 
return 1; 
else 
return 0; 


int main() 


int x, y; 
struct element periodic table[110]; 


x = is it noble(periodic table, y); 


) 
a. ER7&ris it noblel't& iai. 要 占用 多 少 内 存单 元 ? 
b. 在 main 函 数 中 ， 如 果 x、y、periodic_table 是 仅 有 的 局 部 变量 ， 请 问 main 的 活动 记录 中 ， 
有 多 少 位 置 是 用 于 这 些 局 部 变量 的 ? | 

19.5 假设 ， 如 下 C 代 码 被 编译 为 LC-3 机 器 语言 。LC-3 运 行 时 栈 的 起 始 地 址 是 xEFFF。 程 序 运 行 时 ， 
用 户 键入 “abac” 及 回 车 。 请 回答 以 下 问题 ， 


#include <stdio.h> 
#define MAX 4 


struct char_rec { 
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char ch; 
struct char rec *back; 


; 


int main() 


{ 


struct char rec *ptr, pat [MAX+2]; 
int i = 1, j= 1; 


printf("Pattern: "); 
pat[1].back = pat; 
ptr = pat; 


while ((pat[i].ch = getchar()) i= 'WAn') ( 
ptr[++i] .back = «ptr; 
if (i » MAX) break; 

while {j <= i) 
printf("$d ", pat[j++] .back - pat): 

/* Note the pointer arithmetic here: subtraction 
of pointers to Structures gives the number of 
Structures between addresses, not the number 
of memory locations */ 


} 
a. 执行 结束 时 ，main 函 数 栈 空间 的 内 容 是 什么 ? 


b. 如 果 输 入 为 “abac”， 程 序 的 输出 结果 如 何 ? 
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A.1 


附录 A ”LC-3 指 令 集 结构 


概述 


LC-3 的 指令 集结 构 (Instruction Set Architecture, ISA) 定义 如 下 : 


内 存 地 址 空间 (Memory Address Space). 16 位 地 址 ， x0000 


每 


对 应 2* 个 内 存单 元 ， 每 单元 包含 一 个 字 (word), 
字 宽 度 是 16 位 。 地 址 的 编号 从 0 (x0000) 至 65535 
(xFFFF)。 地 址 是 用 以 识别 每 个 内 存单 元 和 内 存 映射 
(memory-mapped) 的 1/O 设 备 寄存 器 。 内 存 中 的 部 分 
区 段 有 着 特殊 用 途 ， 如 图 A-1 所 示 。 

。 位 编号 (Bit Numbering): 量化 数 (quantity) 的 每 个 
位 也 是 有 编号 的 。 通 常 ， 自 右 向 左 ， 最 右边 位 的 编号 
为 0 〈 即 bit 0) ， 最 左边 的 位 编号 是 15 ( 即 bit 15), 

。 指 令 (Instruction); 每 个 指令 的 宽度 是 16 位 。 其 中 ， 
bit[15:12] 是 操作 码 (operation， 即 要 执行 的 操作 ) ， 
bit[11:0] 提 供 指令 执行 时 所 需要 的 信息 ， 具 体 定 义 参 
考 A.3 节 。 

。 非 法 操作 码 异常 (Illegal Opcode Exception); 操作 码 
bit[15:12]=1101 没 有 被 定义 ， 即 如 果 一 个 指令 的 
bit[15:12] 的 内 容 是 1101， 则 产生 “非法 操作 码 异常 ”。 
A.4 节 将 解释 这 个 情况 。 

。 程 序 计数 器 (Program Counter); 16-bit 宽 度 的 一 个 寄 
存 器 ， 其 内 容 是 下 一 条 执行 指令 所 在 的 地 址 。 


xooFF 
x0100 


xO1FF 
x0200 





操作 系统 及 其 内 核 栈 空间 





x2FFF 
x3000 


用 户 程序 占用 空间 


设备 寄存 器 地 址 空间 


图 A-1 LC-3 内 存 映像 图 






xFDFF 
xFEO0 





xFFFF 


通用 寄存 器 (General Purpose register): 宽度 为 16-bit 的 8 个 寄存 器 ， 编 号 分 别 为 000~111 。 


。 条 件 码 (Condition Codes) ，1-bit 宽 度 的 3 个 寄存 器 ， 分 别 是 N (negative), Z (zero), P 


(positive), loadiE4- (LD, LDI, LDR, LEA) 和 运算 指令 (ADD, AND, NOT) 在 向 任 
意 一 个 通用 寄存 器 写 人 数值 时 ， 都 将 改变 条 件 码 。 按 照 16 位 补 码 方式 看 待 这 个 数值 ， 它 有 3 
种 可 能 ， 即 负数 (N-1, Z=0; P-0), 4& (Z=1; N=0; P=0) 和 正 数 (P=1，; N=0; Z=0), 
除 load 和 运算 指令 外 ， 其 他 LC-3 指 令 不 会 改变 条 件 码 。 


。 内 存 映 射 TO (Memory-mapped LO): 由 于 设备 的 输入 /输出 〈 即 MO) 操作 是 由 load/store 指 


4 (LDI/STI, LDR/STR) 完成 的 ， 因 而 我 们 为 每 个 IO 设备 寄存 器 分 配 了 内 存 地址 
(xFE00~xFFFF)。 图 A-1 和 表 A-3 列 举 了 LC-3 的 设备 寄存 器 及 其 分 配 的 内 存 地 址 。 
中 断 处 理 (Interrupt Processing): JO 设 备 具备 中 断 处 理 器 的 能 力 。A.4 节 将 详细 描述 该 机 制 。 


"优先 级 〈Priority Level); LC-3 定 义 了 8 个 优先 级 别 。PL7 (优先 级 7) 最 高 ，PL0 最 低 。 


PSR[10:8] 代 表 当 前 执行 进程 的 优先 级 别 。 
处 理 器 状态 寄存 器 (Processor Status Register, PSR); 16-bit 寄 存 器 ， 包 含 了 当前 执行 进程 的 
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状态 信息 。 其 中 ，PSR 的 8 个 位 已 做 了 定义 ，PSRI[15] 定 义 了 执行 进程 的 权限 模式 ， 
PSR[10:8] 定 义 了 当前 执行 进程 的 优先 级 别 ，PSR[2:0] 包 含 的 是 条 件 码 (PSR[2]-N, 
PSR[1]=Z、PSR[0]=P)。 

。 权 限 模 式 (Privilege Mode); LC-3 定 义 了 两 种 权限 模式 ， 即 特权 模式 和 用 户 模式 。 如 中 断 
服务 程序 的 执行 状态 就 是 “特权 模式 ”。 权 限 模 式 由 PSR[15] 标 识 ，PSR[15]=0 代 表 特 权 模 式 ， 
PSR[15]=1 代 表 用 户 模式 。 

。 权 限 模 式 异 常 (Privilege Mode Exception): 如 果 RTI 指 令 执行 在 特权 模式 下 ， 但 你 试图 在 用 
户 模式 下 执行 RITI 指 令 ， 则 将 产生 “权限 模式 异常 ”。A.4 节 将 对 其 做 详细 解释 。 

: 特权 模式 栈 空 间 (Supervisor Stack): 又 称 内 核 栈 空间 。 在 特权 模式 下 、 通 过 SSP 指 针 
(Supervisor Stack Pointer) 访问 该 内 存 区域 。 事 实 上 ， 特 权 模式 下 (PSR[15]=0) ， 栈 指针 
(R6) 代表 的 就 是 SSP。 

。 用 户 模式 栈 空 间 (User Stack): 在 用 户 模式 下 ， 该 空间 是 由 USP 指 针 (User Stack Pointer) 
访问 的 。 当 PSR[15]=1 时 (用 户 模 式 )， 栈 指针 (R6) 就 是 USP。 


A.2 注释 
表 A-1 ( 见 下 一 页 ) 中 的 注释 ,将 有 助 于 你 更 好 地 理解 对 LC-3 指 令 的 描述 (A.3 节 )。 
A.3 指令 集 


LC-3 定 义 了 一 组 丰富 而 简洁 的 指令 集 。 每 条 指令 (16-bit) 包含 4-bit 的 操作 码 (bit[15:12]) 以 
及 12 位 的 操作 相关 信息 。 图 A-2 汇 总 了 LC-3 的 15 种 操作 码 ， 以 及 其 余 信 息 位 的 使 用 说 明 。 第 16 个 4- 
bit 操 作 码 未 做 定义 。 在 下 面 的 篇 幅 中 ， 将 详细 描述 每 条 指令 的 汇编 语言 表示 、16-bit 指 令 格式 、 指 
令 操作 含义 及 应 用 实例 。 
表 A-1 指令 注释 规范 (Notational Conventions) 





ik ” 释 . & X 

xNumber 数值 的 十 六 进 制 (hexadecimal) 表示 

#Number 数值 的 十 进 制 (decimal) 表示 

A[I:r] 数据 A 的 字段 取 值 ， 左 界 为 bit[1]， 右 界 为 bitrr]。 例 如 ， 
PC=0011001100111111， 则 PC[15:9]=0011001，PC[2:2]=1。 如 果 1 和 rz 相同 ， 则 
可 以 简写 为 PC[2] 

BaseR 基 址 寄存 器 (Base Register)。 通 常 基 址 寄存 器 和 1 个 6-bit 偏 移 相 加 ， 产 生 
Base+offset 地 址 

DR ERIA (Destination Register)。 代 表 R0~R7 之 一 ， 指 令 中 用 于 存放 结果 
的 寄存 器 

imm5 5-bit 立 即 数 (immediate value) 。 当 用 做 立即 数 时 ， 通 常 对 应 指令 中 的 
bit[4:0]。 补 码 (2's complement) 表示 ， 范 围 ~16~15， 使 用 之 前 要 做 16 位 符号 
扩展 

LABEL 汇编 语言 的 一 个 构造 元 素 ， 代 表 一 个 地 址 单元 (符号 表示 ， 而 不 是 16-bit 地 
址 表示 ) 

mem[address] 代表 给 定 地 址 的 内 存单 元 的 内 容 

offset6 6-bit 数 值 ， 指 令 的 bit[5:0]， 用 于 Base+offset 寻 址 模式 。6-bit 有 符号 补 码 ( 范 
围 -32~31)， 所 以 在 计算 Base+offset 时 ， 要 做 16 位 符号 扩展 

PC 程序 计数 器 (Program Counter) 。16 位 寄存 器 ， 指 向 下 一 个 待 获取 指令 的 地 


址 。 例 如 ， 如 果 当 前 指令 所 在 地 址 是 A， 则 PC 的 内 容 是 A+1 
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€ # 
PCoffset9 


PCoffsetl1 


PSR 


setcc() 
SEXT(A) 
SP 
SR,SRI,SR2 


SSP 
trapvect8 


USP 
ZEXT(A) 


(X) 





& x 

9-bit 数 值 ， 指 令 的 bit[8:0]， 用 于 PC+offset 寻 址 模式 。bit[8:0] 被 看 做 是 一 个 
9-bit 的 有 符号 补 码 (范围 是 -256~255) ， 符 号 扩展 至 16-bit 之 后 ， 与 增 量 PC 相 
加 组 成 地 址 

11-bit 数 值 ， 指 令 的 bit[10:0]， 用 于 JSR 指 令 计算 子 程序 的 入 口 地 址 。 
bit[10:0] 被 看 做 是 一 个 11-bit 的 有 符号 补 码 (范围 是 -1024~1023)， 符 号 扩展 至 
16-bit 之 后 ， 与 增 量 PC 相 加 组 成 地 址 

处 理 器 状态 寄存 器 。16-bit 寄 存 器 ， 包 含 了 当前 正在 运行 进程 (process) 的 
状态 信息 。PSR[151= 权 限 模式 ，PSR[2:0] 包 含 的 是 状态 码 (PSR[21=N， 
PSR[1]zZ, PSR[0]-P) 

设置 条 件 码 N、Z、P (基于 写 人 DR 的 数值 )。 如 果 值 为 负 ， 则 N = 1，Z =0，P 
=0， 如 果 值 为 0， 则 N =0，Z= 1, P=0， 如 果 值 为 正 , 则 N =0, 2=0, P=1 

对 A 的 符号 扩展 。A 的 最 高 位 被 复制 填充 前 级 位 ， 直 至 补 齐 了 16 位 。 例 如 ， 
A=11 0000， 则 SEXT(A)=1111 1111 1111 0000 

当前 栈 指 针 。R6 就 是 当前 栈 指针 。 存 在 两 个 栈 ， 分 别 对 应 两 种 权限 模式 
(特权 、 用 户 )。 如 果 PSR[15]=1，SP=USP; 如 果 PSR[15]=0，SP=SSP 

源 寄存 器 。RO~R7 

特权 模式 栈 指针 (Supervisor Stack Pointer) 

8-bit 值 ， 指 令 的 bit[7:0]。 用 于 TRAP 指 令 确 定 trap 服 务 程序 的 人 人 口 地 址 。 
bit[7:0] 被 看 做 是 无 符号 整数 ， 零 扩展 至 16 位 地 址 值 (范围 0~255 )。 读 地 址 内 
存单 元 中 存放 了 TRAP 服 务 程序 的 入 口 地 址 ( 即 间接 寻 址 方式 ) 

用 户 模式 栈 指 针 (User Stack Pointer) 

对 A 的 零 扩 展 。A 的 最 左边 被 填 人 0， 直 至 16 人 位。 例如， 如 果 A=11 0000， 则 
ZEXT(A)-0000 0000 0011 0000 
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图 A-2 LC-3 指 令 集 全 部 指令 的 格式 QE. + 表示 该 指令 将 修改 条 件 码 ) 
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ADD (Addition) 
汇编 器 格式 


ADD  DR,SR1,SR2 
ADD  DR,SRl,imm5 


编码 


15 12, n 9,8 é; 5 4 3,2 0 
15 12,1 9,8 6,5,4 0 


操作 

if (bit[5] == 0) 
DR = SR1 + SR2; 

else 


DR = SR1 + SEXT(imm5); 


setcc(); 


描述 
如 果 bit[5] 是 0， 则 第 2 个 操作 数 来 自 SR2， 如 果 bit[5] 是 1， 则 第 2 个 操作 数 来 自 mm5 字 段 的 16 位 


符号 扩展 值 。 无 论 第 2 个 操作 数 来 自 哪 里 ， 它 都 将 与 SR1 相 加 ， 并 将 结果 存 人 DR。 同 时， 根据 这 个 
数值 的 结果 ， 设 置 对 应 的 条 件 码 (N、Z、P) 。 


例子 
ADD — R2,R3,R4 ;R2<-R3+R4 
ADD R2,R3,#7 ;R2<-R3+7 


AND (Bit-wise logical AND) 


汇编 器 格式 
AND DR,SR1,SR2 
AND DR,SR1,imm5 


编码 


15 12,11 9,5 ó, 5,4 3,2 0 


LNBCNECEDEIN- S 

l 

15 12,1 9,8 6,5,4 9 
T T^ T T T- 

0101 | pe jm hl imm5 

-一 上 一 -上 上 Lol l 











操作 
if (bit[5] == 0) 
DR-SR] AND SR2; 
else 
DR-SR1 AND SEXT(imm5); 
setcc(); 
描述 


如 果 bit[5] 是 0， 则 第 2 个 操作 数 来 自 SR2， 如 果 bit[5] 是 1， 则 第 2 个 操作 数 来 自 mm5 字 段 的 16 位 
符号 扩展 值 。 无 论 第 2 个 操作 数 来 自 邵 里 ， 它 都 将 与 SR1 做 “ 按 位 与 ”(bit-wise AND) 运算 ， 并 将 
结果 存 人 DR。 同 时 ， 根 据 这 个 数值 的 结果 ， 设 置 对 应 的 条 件 码 (N, Z, P), 
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例子 
AND R2,R3,R4 ;R2«-R3 AND R4 
AND R2,R3,£7 :R2«-R3 AND 7 
BR (Conditional Branch) 














汇编 器 格式 

BRn LABEL BRzp LABEL 

BRz LABEL BRnp LABEL 

BRp LABEL BRnz LABEL 

BR LABEL BRnzp LABEL 

Ih 

15 12,11,10,9 ,8 0 
T T T T T T ^T T T T 
0000 nizip PCotfset9 | 
1 1 LLL. L 上 


if ((n AND N) OR (z AND Z) OR (p AND P)) 
PC = PCO + SEXT(PCoffset9); 


描述 
由 bit[11:9] 指 定 的 条 件 码 被 测试 。 即 如 果 bit[11]=1, 则 N 被 测试 ， 如 果 bit[11]=0， 则 NN 不 被 测试 。 


Z 和 P 同 理 。 如 果 任 何 一 个 被 指定 测试 的 条 件 码 被 置 位 ， 则 程序 跳 转 至 PCoffset9 字 段 的 符号 扩展 和 





增 量 PC 之 和 的 地 址 处 。 
例子 
BRzp LOOP a 如 果 最 后 的 结果 是 零 (zero) 或 正 数 (Positive)， 跳 转 至 LOOP 
BRO NEXT ; 无 条 件 跳 转 至 NEXT 
JMP (Jump) 
RET 
汇编 器 格式 
JMP BaseR 
RET 
编码 
15 12, 9 8 é 5 0 
JMP 1100 000 | BaseR 00000 — 
15 12, 9 8 6 5 0 
RET [ moo | wo | mr | om 
操作 
PC = BaseR 
描述 


程序 无 条 件 地 跳 转 至 由 基 址 寄存 器 的 内 容 指定 的 人 口 。bit[8:6] 代 表 该 基 址 寄存 器 的 编号 。 
例子 


© HEPC, 
O iA EH BRÉBRnzpész4dgBI)É), MEERA RRE, MRR A ieh (无 条 件 跳 转 )。 


344 BRA 


JMP R2 ;PC—R2 
RET ;PC—R7 
备注 


RET 指 令 可 以 看 做 是 JMP 指 令 的 一 个 特例 。PC 被 装 人 R7 的 内 容 ，R7 扮 演 的 是 链接 (linkage) 


的 作用 ， 其 内 容 是 指向 子 程序 调用 指令 之 后 的 指令 地 址 。 


JSR (Jump to Subroutine) 


JSRR 
汇编 器 格式 
JSR LABEL 
JSRR BaseR 


编码 
15 12 1t 10 0 


sr [ram pE ee 
JSRR 15 12 ~ coana ^ 0 





操作 
R7 = PCO; 
if (bit[11] == 0) 
PC = BaseR; 
else 
PC = PC + SEXT(PCoffsetll); 
描述 


首先 ， 增 量 PC 值 被 保存 在 R7 中 ， 这 是 返回 调用 代码 的 链接 (linkage) 地 址 ， 然 后 PC 装 和 人 被 调 


用 子 程序 的 入 口 地 址 ， 即 等 价 于 无 条 件 跳 转 至 该 地 址 。 子 程序 的 入 口 地 址 来 自 基 址 寄存 器 (如 果 
bit[11]=0) ， 或 是 bit[10:0] 符 号 扩展 值 和 增 量 PC 之 和 如果 bit[11]=1)。 


LD 


例子 
JSR QUEUE ; 将 JSR 指 令 之 后 的 地 址 装 入 R7 ， 然 后 跳 转 至 QUEUE 
JSRR R3 ; 将 JSRR 指 令 之 后 的 地 址 装 入 R7， 然 后 跳 转 至 R3 内 容 指定 的 地 址 


(Load) 
汇编 器 格式 
LD DR, LABEL 


编码 


15 12,1? 9,8 0 
T^ 7T 





操作 


DR = mem(PCO + SEXT(PCoffset9)); 


© E (incremented) PC, 
© HEPC, 
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setcc(); 
描述 


由 bit[8:0] 的 16 位 符号 扩展 值 和 增 量 PC 相 加 ， 计 算出 一 个 地 址 ， 然 后 将 该 地 址 的 内 存单 元 内 容 
装 入 DR 寄存 器 。 同 时 ， 根 据 装 和 数值 的 内 容 ， 设 置 相 应 的 条 件 码 。 
例子 


LD R4, VALUE ; R4—mem[VALUE] 


LDI (Load indirect) - 
汇编 器 格式 


LDI DR, LABEL 
编码 
15 12, 9 | 8 0 


1010 DR PCoffsel9 
dor i A S doa. as d d 


操作 


DR = mem[mem[PC + SEXT(PC offset9)]]; 





setcc(): 

描述 

由 bit[8:0] 的 16 位 符号 扩展 值 和 增 量 PC 相 加 ， 计 算出 一 个 地 址 ， 然 后 再 将 该 地 址 的 内 存单 元 内 
容 作为 地 址 ， 再 次 读 取 内 存 ， 并 将 获取 的 内 容 装 入 DR 寄存 器 。 同 时 ， 根 据 装 人 数值 的 内 容 ， 设 置 
相应 的 条 件 码 。 

例子 


LDI R4, ONEMORE ; R4«-mem[mem[ ONEMORE ] ] 


LDR (Load Base+offset) 





汇编 器 格式 

LDR DR, BaseR, offset6 

编码 

15 12 11 9,5 6,5 0 
LLL. 

操作 

DR = mem[BaseR + SEXT(offset6)]; 

setcc(í(); 

描述 


由 bit[5:0] 的 16 位 符号 扩展 值 和 bit[8:6] 指 定 寄 存 器 的 内 容 相 加 ， 计 算出 一 个 地 址 ， 然 后 将 该 地 
址 的 内 存单 元 内 容 装 人 DR 寄存 器 。 同 时 ， 根 据 装 入 数值 的 内 容 ， 设 置 相应 的 条 件 码 。 
例子 


LDR Râ, R2,f-5 ; R4«-mem[R2-5] 


O XHBPC, 
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LEA (Load Effective Address) 








汇编 器 格式 
LEA DR, LABEL 
编码 
15 12 ，11 9 18 0 
T 下 F T T T T T- 
1110 DR | PCoffsef9 
上 1 外 Lt 上 IL LL a  LJ L 1 

操作 
DR = PCO + SEXT(PCoffset9); 
setcc(); 
描述 


由 bit[8:0] 的 16 位 符号 扩展 值 和 增 量 PC 相 加 ， 计 算出 一 个 地 址 ， 然 后 将 该 地 址 值 装 入 DRe 寄 存 
器 。 同 时 ， 根 据 装 入 数值 的 内 容 ， 设 置 相 应 的 条 件 码 。 
例子 


LEA R4, TARTGET ; R4<-address of TARGET 


NOT (Bit-wise Complement) 


汇编 器 格式 


NOT DR, SR 


编码 


[ 32, T T 3 2 | 


操作 
DR = NOT(SR); 
setcc(); 


描述 
将 SR 的 内 容 按 位 取 补 码 (bit-wise complement， 即 反 码 ) 存 人 DR。 基 于 变换 出 来 的 数值 是 否 


为 负数 、 零 、 正 数 ， 设 置 相应 的 条 件 码 。 
例子 


NOT R4, R2 ; RA«-NOT(R2) 
RET? (Return from Subroutine) 
汇编 器 格式 


RET ; 


编码 


15 2n 9 8 é 5 0 





O HEPC, 
加 ”LEA 指 令 并 不 读 取 内 存 ， 只 是 将 计算 出 来 的 该 内 存单 元 的 地 址 赋值 给 DR。 
© RET 指 令 可 以 理解 为 是 JMP 指 令 的 一 个 特例 ， 参 见 JMP。 
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操作 

PC = R7; 

描述 

将 R7 的 内 容 装 人 PC。 由 于 R7 扮 演 的 是 linkage 的 角色 (参见 JSR/JSRR) ， 所 以 RET 指 令 产生 的 
效果 ， 就 是 返回 之 前 JSR 调 用 点 的 下 一 条 指令 。 

例子 


RET ; PC «- R7 
HT! (Return from Interrupt) 


汇编 器 格式 


RTI 


15 EFEN o 
T~ TT 
1000 000000000000 
| 


操作 
if (PSR[15] == 0) 
PC = mem[R6]; R6 is the SSP 
R6 = R6 + 1; 
TEMP - mem[R6]; 
R6 - R6 * 1; 
PSR - TEMP; the privilege mode and condition codes of 











the interrupted process are restored 


eise 
Initiate a priviledge mode exception; 


描述 

如 果 当 前 处 理 器 运行 在 特权 模式 ， 则 该 指令 执行 是 合法 的 ， 特 权 模 式 栈 (Supervisor Stack ) 
顶部 两 个 单元 的 内 容 被 弹出 (pop), ， 并 分 别 赋 值 给 PC 和 PSR。 如 果 当 前 处 理 器 运行 在 用 户 模 式 ， 
则 该 指令 的 执行 将 引发 “特权 模式 冲突 ”异常 。 

例子 

RTI ; PC,PSR «- top two values popped off stack. 

备注 

当 外 部 中 断 (interrupt) 或 内 部 异常 (exception) 发 生 时 ， 处 理 器 最 先 做 的 事 ， 就 是 将 权限 模 
式 切 换 到 特权 模式 (PSR[IS]-0) ， 然 后 将 PSR 和 PC 的 内 容 压 人 (push) 特权 模式 栈 ， 最 后 将 中 断 
或 异常 服务 程序 的 人口 地 址 装 人 PC。 中 断 或 异常 服务 程序 一 定 是 运行 在 特权 模式 下 的 ， 服 务 程序 
的 最 后 一 条 指令 一 定 是 RII ( 即 恢复 原 PC 和 PSR 内 容 )。 有 关 PC 的 内 容 ， 在 中 断 情况 下 ， 被 使 复 的 
(或 返回 的 ) PC 内 容 是 中 断 发 生 时 即将 执行 的 指令 的 地 址 ;而 异常 情况 下 ，PC 的 恢复 内 容 可 能 是 
引发 异常 的 指令 地 址 (使 之 重新 执行 一 遍 )， 也 可 能 是 其 下 一 条 指令 的 地 址 (无需 重新 执行 )。 有 
关 PSR， 异 常 模式 也 比较 复杂 。 中 断 情况 的 PSR 内 容 恢 复 为 中 断 发 生 时 的 现场 值 ， 而 异常 模式 下 可 
能 恢复 为 原 现场 值 ， 也 可 能 被 修改 。 另 外 ， 如 果 当 前 处 理 器 运行 在 用 户 模式 ， 该 指令 将 引发 “ 权 
限 模 式 冲突 ”异常 。 以 上 细节 的 解释 参见 A.4 节 的 论述 。 


FERA 
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ST 


(Store) 


汇编 器 格式 


ST SR, LABEL 


编码 


15 mn 9,8 0 


操作 


mem[PCO + SEXT(PCoffset9)] = SR; 


描述 
由 bit[8:0] 的 16 位 符号 扩展 值 和 增 其 PC 相 加 ， 计 算出 一 个 地 址 ， 然 后 将 SR 指定 寄存 器 的 内 容 装 


入 该 地 址 指向 的 内 存单 元 中 。 


STI 


例子 


ST R4, HERE ;mem( HERE ] «-R4 


(Store indirect) 


汇编 器 格式 


STI SR, LABEL 


编码 


15 12,1 9,5 0 
LL LL —L. į 1 


操作 


mem[mem[PCO + SEXT(PCoffset9)]] = SR; 


描述 
由 bit[8:0] 的 16 位 符号 扩展 值 和 增 量 PC 相 加 ， 计 算出 一 个 地 址 A， 然 后 以 读 地 址 A 指 向 的 内 存单 





元 的 内 容 B 作 为 地 址 ， 将 SR 指定 寄存 器 的 内 容 装 入 该 地 址 B 指 向 的 内 存单 元 中 。 


例子 


STI R4, NOT HERE ; mem[mem[NOT HERE]]«-R4 


STR (Store Base-offset) 





汇编 器 格式 
STR SR, BaseR, offset6 
编码 
15. 12 11 ?,8 0 
SR PCoffsel9 
二 下 一 一 上 一 | 一 
操作 


mem[BaseR + SEXT(offset6)] = SR; 


© JJEPC, 
© 3XPC. 
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à ik 
由 bit[5:0] 的 16 位 符号 扩展 值 和 bit[8:6] 指 定 寄存 器 的 内 容 相 加 ， 计 算出 一 个 地 址 ， 然 后 将 SR 指 


定 寄存 器 的 内 容 装 人 该 地 址 的 内 存单 元 中 。 
例子 


STR R4, R2, #5 ; mem{R2+5]<-R4 


TRAP (System Call) 


汇编 器 格式 


TRAP trapvector8 


编码 


R7 = PCO; 
= mem[ZEXT(trapvect8)]; 


描述 
首先 将 增 量 PC 装 和 人 R7 (为 服务 程序 返回 做 准备 )。 然 后 将 由 trapvector8 指 定 的 系统 调用 的 入 口 
地 址 装 入 PC (等 价 于 跳 转 )。 注 意 ， 这 个 入 口 地 址 的 计算 是 间接 的 ， 即 先 将 trapvector8 零 扩展 为 一 
个 16-bit 地 址 ， 然 后 读 取 该 地 址 单元 的 内 容 ， 作 为 服务 程序 的 人 口 地 址 。 
例子 
TRAP x23 : Directs the operating system to execute the IN system call 
; The starting address of this system call is contained in 
: memory location x0023. 
备注 
内 存单 元 x0000~x00FF， 共 256 个 ， 用 来 存放 各 个 陷入 矢量 (trap vector) 所 对 应 的 系统 服务 程 
序 的 入口 地 址 ， 所 以 该 区 段 又 被 称 为 “陷入 矢量 表 ”(Trap Vector Table)。 表 A-2 列 出 了 陷入 矢量 
x20~x25 所 对 应 的 各 个 服务 程序 。 


Unused Opcode 
汇编 器 格式 


none. 


编码 


15 12 on 0 
T Y 1 T T TT" TT T7 
| 1101 B : 
DAS OSSOS ONG DONON OSOS S d 一 人 LL. 
操作 
Initiate an illegal opcode exception. 


描述 
该 操作 码 所 对 应 的 指令 未 做 定义 。 即 意味 着 如 果 执行 该 指令 ， 将 引发 “非法 指令 ” (illegal 








O ” 增 量 PC。 
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opcode) 异常 。 

备注 

操作 码 (1101) 是 预 留 以 后 做 定义 的 。 如 果 当 前 执行 指令 的 操作 码 的 bitt15:12]=1101， 则 产生 
非法 指令 异常 ， 参 见 A.4 届 的 描述 。 


XA-2 Trap 服 务 程序 








陷入 矢量 汇编 器 名 描述 

x20 GETC 从 键盘 读 和 人 一 个 字符 。 但 该 字符 并 不 在 屏幕 上 回 显 
(echo)。 该 字符 的 ASCH 码 值 被 找 贝 人 RO (R0 的 高 8 位 被 
清 零 ) 

x21 OUT 将 R0[7:0] 的 字符 输出 在 屏幕 上 显示 

x22 PUTS 向 屏幕 写 一 个 字符 串 。 所 有 字符 在 内 存 中 的 存放 是 连 


续 的 ， 且 每 个 内 存单 元 一 个 字符 。 起 始 地 址 由 RO 指定 ， 
结束 判断 由 当前 内 存单 元 是 否 为 x0000 确 定 

x23 IN 先 打印 提示 (prompt) 在 屏幕 上 ， 然 后 等 待 键盘 输入 
一 个 字符 。 读 人 字符 回 显 在 屏幕 上 ， 读 入 的 ASCII 码 装 
入 RO0，R0 高 8 位 清 零 

x24 PUTSP 向 屏幕 写 一 个 字符 串 。 所 有 字符 在 内 存 中 的 存放 是 连 
续 的 ， 但 每 个 内 存单 元 存放 两 个 字符 。 输 出 显示 时 ， 人 先 
将 bit[7:0] 输 出 ， 然 后 再 将 bit[15:8] 输 出 (如 果 一 个 字符 
串 的 字符 个 数 是 奇数 个 ， 则 最 后 一 个 内 存单 元 的 内 容 
bitf15:8] 为 x00) 。 起 始 地 址 由 R0 指 定 ， 结 束 判断 由 当前 
内 存单 元 是 否 为 x0000 确 定 : 

x25 HALT 停止 执行 ， 并 在 屏幕 上 输出 信息 





表 A-3 设备 寄存 器 分 配 





地 址 寄存 器 名 寄存 器 的 功能 

xFE00 Keyboard status register KBSR, Readyfz (bit[15]) 表示 是 否 已 接收 到 一 个 新 
的 键盘 字符 输入 

xFE02 Keyboard data register KBDR。bit[7:0] 包 含 的 是 最 新 接收 的 字符 

xFE04 Display status register DSR, Readyfz (bit[15]) 表示 显示 设备 目前 是 否 可 
以 接收 下 一 个 待 显 示 字 符 

xFE06 Display data register DDR。 该 寄存 器 低 字 节 ( 即 bit[7:0]) 包含 的 是 待 显 示 - 
字符 

xFFFE Machine control register MCR。bit[15] 是 时 钟 使 能 位 ， 该 位 清 零 时 ， 机 器 停止 
运行 





A.4 中 断 和 异常 处 理 


外 部 事件 (event external) 能 够 中 断 (interrupt) (而 不 是 halt) 当前 正在 运行 的 程序 。 最 常见 的 外 
部 事件 就 是 IO 中 断 驱 动 (interrupt-driven 1/0), AE, ， 运 行程 序 本 身 也 可 能 产生 异常 事件 
(exceptional event) 中 断 处 理 器 的 运行 ， 如 非法 指令 〈 即 无 效 操作 码 ) 就 是 一 个 “内 部 ”事件 的 例子 。 

事件 (event) 处 理 涉及 很 多 数据 结构 ， 中 断 失 量 表 (interrupt vector table) 就 是 其 一 ， 该 表 
共有 256 个 表 项 ， 每 个 表 项 对 应 一 种 事件 (所谓 “ 和 矢量 ”就 是 事件 的 编号 ) 。 中 断 矢 量 表 的 起 始 地 
址 是 x0100， 即 意味 着 该 表 内 存 占用 空间 的 范围 是 x0100~x01FF。 表 项 包含 了 该 矢量 服务 程序 的 入 
口 地 址 ， 所 谓 “ 服 务 程 序 ”， 就 是 由 械 作 系统 提供 的 处 理 该 事件 的 专用 程序 ， 值 得 提醒 的 是 ， 服 务 
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程序 执行 在 特权 模式 下 。 

该 表 的 前 128 个 表 项 (x0100~x017F) 是 程序 自身 引发 事件 ( 即 exception) 的 处 理 程序 入 口 地 址 ， 
通常 称 它们 为 “异常 服务 程序 ”({exception service routine)。 之 所 以 称 这 些 事件 为 异常 (exception) 
而 不 是 中 断 (interruption)， 是 因为 这 些 事件 的 发 生 是 “意外 的 "， 会 影响 程序 的 正常 执行 。 

该 表 后 半 部 分 的 128 个 表 项 (x0180~0x01FF) 是 外 部 事件 的 服务 程序 入 口 地 址 ， 如 来 自 WVO 设 
备 的 请 求 事件 处 理 程序 ， 通常 称 它们 为 “中 断 服 务 程 序 ”(interrupt service routines) 。 


A.4.1 中 断 


虽然 LC-3 提 供 了 能 够 服务 MO 中 断 的 矢量 机 制 ， 但 事实 上 LC-3 计 算 机 系统 只 提供 了 惟一 一 种 能 
产生 中 断 的 IO 设备 ， 即 键盘 (keyboard) 。 它 的 中 断 优 先 级 是 PL4， 对 应 的 中 断 矢 量 是 x80。 

一 个 MO 设备 如 果 希 望 获得 服务 ( 即 获得 “关注 ) ， 它 将 试图 中 断 处 理 器 。 如 果 当 前 中 断 使 能 
(Interrupt Enable, IE) 位 是 1， 且 中 断 请 求 的 优先 级 比 当 前 运行 程序 的 优先 级 高 ， 则 中 断 成 功 。 

下 面 举 例 说 明 中 断 的 处 理 机 制 。 假 设 当前 程序 运行 级 别 小 于 PL4， 且 此 时 有 人 按 动 键盘 。 如 果 
KBSR 的 IE 位 为 1， 则 当前 指令 周期 结束 之 后 程序 被 中 断 〈 即 程序 暂停 ) 。 随 后 ， 中 断 服务 程序 被 激 
活 (initiated); 

(1) 处 理 器 硬件 自动 将 权限 模式 设置 为 特权 模式 (PSR[15]-0), 

(2) 同时 ， 将 优先 级 别 设置 为 PL4， 即 该 设备 对 应 的 中 断 处 理 优先 级 (PSRf10:8]=100) 。 

(3) 将 特权 栈 指针 (SSP) 寄存 器 的 内 容 装 入 R6 寄 存 器 。 

(4) 将 PSR 和 PC 的 内 容 压 人 特权 栈 。 

在 处 理 器 的 硬件 自动 完成 以 上 操作 之 后 : 

(5) 键盘 设备 提供 一 个 8-bit 的 矢量 ， 即 x80。 

(6) 处 理 器 将 该 矢量 值 (x80) 扩展 为 x0180， 即 该 中 断 矢 量 表 项 所 在 的 位 置 。 

(7) 将 x0180 地 址 内 存单 元 的 内 容 装 入 PC， 即 等 价 于 “ 跳 转 ”入 键盘 中 断 服务 程序 。 

在 以 上 硬件 操作 之 后 ， 进 入 软件 运行 阶段 : 

(8) 处 理 器 开始 了 中 断 服务 程序 的 执行 。 

中 断 服务 程序 的 最 后 一 条 指令 是 RTI。 当 RTI 被 执行 时 ， 硬 件 又 将 自动 完成 以 下 操作 : 

(9) 特权 栈 顶 部 两 个 单元 的 内 容 被 弹出 ， 恢 复原 先 PC 和 PSR 寄 存 器 的 内 容 。 

(10) 根据 当前 的 PSR[15] 内 容 ，R6 将 被 装 和 人 合适 的 栈 指针 值 。 

在 完成 以 上 中 断 处 理 之 后 ， 原 先 被 中 断 的 程序 恢复 执行 (注意 ， 被 中 断 的 程序 可 能 是 用 户 程 
序 ， 也 可 能 是 操作 系统 ) 。 


A.4.2 异常 


LC-3 计 算 机 系统 只 定义 了 两 种 异常 情况 ， 即 “权限 模式 冲突 ”和 “非法 指令 *。 权 限 模式 冲突 
的 异常 情况 ， 是 在 用 户 模式 下 遇 到 RTI 指 令 ， 而 非法 指令 的 异常 情况 ， 是 处 理 器 遇 到 操作 码 
(bii[15:12]). 为 1101 的 指令 。 

对 于 处 理 器 来 说 ， 一 旦 遇 到 异常 ， 必 须 尽 快 处 理 ! 异常 服务 程序 的 激活 (initiated) 方式 和 中 
断 类 似 ， 

(1) 处 理 器 切换 (设置) 权限 模式 至 特权 模式 (PSR[ISI-0), 

(2) R6 被 装 和 人 特权 栈 指针 (SSP) 寄存 器 的 内 容 。 

(3) PSR 和 PC 的 内 容 被 压 人 特权 栈 。 

(4) 异常 处 理 模块 提供 它 的 8-bit 的 矢量 。 如 果 是 权限 模式 冲突 ， 则 提供 的 矢量 是 x00， 如 果 是 
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非法 指令 ， 提 供 的 矢量 是 x01。 
(5) 处 理 器 将 该 矢量 扩展 为 0100 或 x0101， 即 对 应 的 中 断 矢 量 表 项 的 地 址 。 


(6) 将 x0100 或 x0101 地 址 内 存单 元 的 内 容 装 人 PC， 即 异常 服务 程序 的 入 口 地 址 。 

于 是 ， 处 理 器 开始 异常 服务 程序 的 执行 。 

异常 服务 程序 的 处 理 细节 取决 于 不 同 的 异常 类 型 和 操作 系统 的 处 理 风格 。 

在 一 些 特定 情况 下 ， 异 常服 务 程序 能 够 纠正 异常 问题 ， 并 恢复 原 程 序 的 执行 。 那 么 在 这 种 情 
况 下 ， 服 务 程序 的 最 后 一 条 指令 一 定 是 RTI， 即 将 特权 栈 顶 部 两 个 单元 的 内 容 弹出 ， 并 分 别 装 入 PC 
和 PSR 寄 存 器 ， 随 后 恢复 原 程 序 的 执行 。 

但 在 大 多 数 情况 下 ， 异 常 的 出 现 是 灾难 性 的 ， 即 服务 程序 (操作 系统 ) 应 该 取消 原 程序 的 
执行 。 

此 外 ， 中 断 处 理 和 异常 处 理 的 区 别 是 服务 程序 执行 的 优先 级 别 。 中 断 服务 程序 运行 时 ， 通 常 
将 优先 级 别 自动 设置 为 不 同 设备 所 对 应 的 级 别 ， 而 异常 处 理 时 ， 通 常 我 们 不 改变 优先 级 别 。 程 序 
原本 所 具有 的 优先 级 别 ， 事 实 上 就 代表 了 该 程序 本 身 的 “紧迫 度 ”(urgency) ， 所 以 在 处 理 它 的 事 
件 时 ， 也 没有 必要 改变 这 个 “紧迫 度 ”。 例 如 ，LC-3 ISA 定 义 的 两 个 异常 ， 即 权限 模式 冲突 发 生 或 
程序 中 存在 非法 指令 时 ， 就 没有 必要 改变 服务 程序 运行 的 优先 级 。 


附录 B 从 LC-3 到 x86 


正如 你 所 知 ，LC-3 指 令 集 结构 GSA) 显 式 地 指定 了 LC-3 机 器 语言 (由 程序 员 编 写 或 由 LC-3 
编译 器 产生 ) 与 LC-3 微 结构 (接受 指令 并 进行 处 理 ) 之 间 的 接 日 。 指 令 集 的 定义 范畴 包括 内 存 地 
址 空间 及 其 可 寻 址 能 力 、 寄 存 器 数目 和 大 小 、 指 令 的 格式 、 操 作 码 、 数 据 编码 方式 ， 以 及 操作 数 
的 数据 类 型 及 其 录 址 模式 。 , 

同样 ， 在 你 的 PC 机 上 ， 也 存在 一 个 指令 集结 构 ， 它 也 指定 了 (对 应 于 微 处 理 器 的 ) 编译 器 和 
微 结构 之 间 的 接口 。 不 同 的 是 ，PC 机 的 指令 集 是 x86， 而 不 是 LC-3。Intel 在 1979 年 设计 并 实现 了 该 
架构 ( 即 x86) 的 第 一 个 成 员 一 一 8086， 它 规定 了 地 址 和 数据 的 大 小 都 是 16 位 ， 而 今天 ， 地 址 和 数 
据 的 标准 大 小 已 演变 为 32 位 。 从 8086 至 今 ，Intel 的 系列 产品 结构 一 直 都 遵循 着 该 指令 系统 集 ， 如 
80286 (1982), 386 (1985), 486 (1989), Pentium (1992), Pentium Pro (1995), Pentium II 
(1997), Pentium III (1999) 和 Pentium IV (2001), 

相 比 之 下 ，x86 的 指令 集 要 比 LC-3 的 指令 集 复杂 得 多 。X86 包 含 更 多 的 操作 码 ， 更 多 的 数据 类 
型 ， 更 多 的 寻 址 模式 ， 更 复杂 的 内 存 结构 ， 以 及 更 复杂 的 0/1 编 码 方式 。 但 本 质 上 ， 我 们 说 它们 
(x86 和 LC-3) 具有 相同 的 基本 要 素 。 

我 们 已 经 花 了 很 多 精力 去 学 习 、 理 解 与 LC-3 相 关 的 东西 ， 或 许 有 人 会 觉得 ， 我 们 还 应 该 学 习 
一 些 “ 真 实 ” 的 指令 集 知识 。 在 此 要 提醒 的 是 ， 那 些 在 做 以 及 能 够 做 此 类 事情 ( 即 学 习 研 究 真实 
指令 集结 构 ) 的 人 ,都 是 诸如 Intel 公 司 (大 规模 生产 LC-3 类 芯片 )、Dell 公 司 (基于 芯片 制造 PC 机 )， 
以 及 Microsoft 公 司 (为 LC-3 类 指令 集结 构 编译 Windows NT 操作 系统 程序 ) 等 专业 “人 士 "。 当 然 ， 
还 有 一 种 更 容易 的 学 习 “ 真 实 ” 指 令 集 的 方法 ， 即 阅读 本 附录 。 

下 面 我 们 开始 介绍 x86 的 有 关 要 素 ， 这 是 一 种 非常 复杂 的 指令 集 。 尽 管 它 很 复杂 ， 但 我 们 仍然 
要 介绍 它 ， 因 为 它 是 人 们 接触 最 普遍 的 一 种 处 理 器 。 

当然 ， 我 们 并 不 打算 介绍 完整 的 x86 ISA 规 范 。 因 为 ， 要 做 到 这 一 点 ， 需 要 整整 一 本 书 来 描述 ， 
同时 还 涉及 到 操作 系统 、 编 译 器 和 计算 机 系统 在 内 的 各 方面 知识 ， 这 远 远 超出 了 目前 的 知识 范畴 。 
如 果 要 详细 研究 它 ， 我 们 推荐 1997 年 由 Intel 公 司 出 版 的 《Intel 架 构 软件 开发 者 手册 》 的 1、2、3 卷 。 
本 附录 中 ， 我 们 只 讨论 与 应 用 程序 (而 不 是 操作 系统 ) 相关 的 x86 ISA 特 性 方面 的 知识 。 我 们 的 目 
的 是 ， 通 过 这 些 内 容 ， 让 你 对 x86 指 令 集 的 丰富 性 有 直观 的 认识 ， 然 后 结合 我 们 所 熟悉 的 LC-3 指 令 
集 ， 探 索 、 体 会 这 些 特 性 在 LC-3 的 设计 和 实现 中 的 应 用 。 


B.1 LC-3 与 X86 特性 比较 


B.1.1 指令 集 


一 个 指令 集 包 含 了 许多 不 同 的 指令 ， 每 条 指令 又 包含 一 个 操作 码 和 若干 个 操作 数 。 操 作 数 的 
具体 数目 取决 于 操作 码 的 类 型 。 我 们 称 其 中 的 每 个 操作 数 为 一 个 数据 元 素 ， 并 基于 数据 类 型 而 编 
码 。 另 外 ， 操 作 数 的 来 源 取决 于 当前 指令 指定 的 寻 址 模式 。 

LC-3 指 令 集 有 具备 一 种 数据 类 型 、15 个 操作 码 和 3 种 寻 址 模式 ， 这 3 种 寻 址 模式 是 : 相对 PC 寻 址 
(LD/ST), 、 间 接 寻 址 (LDI/STI) 和 寄存 器 加 偏 移 寻 址 (LDR/STR), 。 而 x86 指 令 集 则 拥有 多 达 12 种 
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数据 类 型 、200 多 个 操作 码 和 几 十 种 寻 址 模式 。 

1. 数据 类 型 

数据 类 型 是 指 信息 的 表达 形式 ， 特 定 的 指令 系统 只 能 处 理 特定 编码 类 型 的 操作 数 。 

LC-3 只 支持 一 种 数据 类 型 ， 即 16 位 补 码 整数 ， 当 然 这 远 不 足以 应 对 真实 世界 的 计算 需求 ， 如 ，: 
科学 计算 类 应 用 程序 需要 浮 点 数 类 型 ， 多 媒体 应 用 程序 则 需要 另 一 种 特定 数据 类 型 ， 一 些 仍 在 使 
用 的 早期 商业 程序 ， 还 使 用 一 种 称 做 压缩 十 进 制 数 (packed decimal) 的 数据 类 型 。 总 是 存在 着 那 
么 一 些 应 用 ， 它 们 比 普 通 应 用 需要 更 大 的 数值 范围 和 更 高 的 数值 精度 。 

由 于 这 些 需 求 的 存在 ，x86 设 计 了 8-bit 整 数 、16-bit 整 数 、32-bit 整 数 、32-bit 浮 点 数 、64-bit 浮 
点 数 ， 以 及 64-bit 和 128-bit 多 媒体 数 等 数值 类 型 ， 及 其 相应 的 操作 指令 。 图 B-1 所 示 是 x86 指 令 系统 


的 各 种 数据 类 型 。 


整数 
了 0 
|] 
15 0 
| 
31 0 
ET 
无 符号 整数 
7 0 
CL —l 
15 0 
记 
31 0 
[Lc] 
BCD 编 码 整数 20 16 12 8 4 0 
digit N digit 2 digit 1 digit O 
压缩 型 BCD 12 8 4 0 
TIT 1“] 1 I 1 
digit digit digit digit digit digit 
N N-1 3 2 1 0 
浮 点 数 
31 22 0 
BEC — |] —  ———— | 
指数 尾数 
63 51 0 
(SL LL ÉL — _ -| 
` 79 指数 63 尾数 0 
SD] 
指数 尾数 
fri 
.. X+4 X+3 X42 X 1 address X 
last bit 位 * 的 长 度 bit o 
MMX 的 操作 数 类 型 
63 48 32 16 0 
元 素 3 元 素 2 元 素 1 元 素 0 
63 56 48 40 32 24 16 8 0 
LC TIL LLL LLLI IL 
7 6 5 4 3 2 1 元 素 0 


图 B-1 x86 的 各 种 数据 类 型 
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2. 操作 码 
LC-3 包 含 15 种 操作 码 ， 而 x86 指 令 集 则 包含 200 多 种 操作 码 。 但 正如 我 们 之 前 所 论述 的 ， 无 论 


一 种 指令 系统 的 指令 数目 有 多 少 ， 其 基本 类 型 都 只 有 三 类 ， 即 运算 操作 指令 、 数 据 搬移 指令 和 控 
制 指令 。 运 算 操 作 是 指 信息 的 运算 处 理 ， 数 据 搬移 是 指 将 数据 从 一 个 地 方 拷贝 到 另 一 个 地 方 ( 包 
括 设备 的 输入 /输出 )， 而 控制 操作 则 是 改变 指令 流 的 流向 。 

除 此 之 外 ， 我 们 还 应 该 补充 一 种 现实 中 必需 的 类 型 ， 即 系统 管理 类 指令 。 由 于 现实 中 用 户 程 
序 并 不 是 独立 运行 的 ， 即 它 总 是 运行 在 操作 系统 所 掌控 的 执行 环境 下 的 。 换 句 话说， 这 些 指令 只 
能 被 操作 系统 〈《 即 特权 程序 ) 执行 ， 而 不 能 由 应 用 程序 执行 。 它 们 的 功能 涉及 计算 机 安全 、 系 统 
管理 、 硬 件 性 能 监测 等 一 般 应 用 程序 无 需 关注 的 方面 。 在 本 附录 中 ， 我 们 将 不 讨论 这 些 指 令 ， 但 
要 提醒 的 是 ， 它 们 确实 存在 ， 在 今后 的 学 习 中 ， 你 将 遇 到 它们 (如 操作 系统 课程 )。 

下 面 我 们 将 重点 讨论 三 种 基本 指令 类 型 ， 操作 指令 、 数 据 搬移 指令 和 控制 指令 。 

3. 运算 操作 指令 

LC-3 的 运算 操作 指令 有 三 条 ; ADD、AND 和 NOT。 其 中 ，ADD 是 LC-3 中 惟一 的 算术 运算 操 
作 码 。 如 果 做 减法 ， 只 需 加 该 操作 数 的 负 值 即 可 。 如 果 粗 做 乘法 ， 则 需要 写 一 个 循环 加 的 程序 。 
当然 ， 这 对 于 真实 的 微 处 理 器 来 说 是 相当 耗 时 的 操作 。 因 此 ，x86 有 专门 的 SUB、MUL、DIV、 
INC (递增 )、DEC CGR) 和 ADC ( 带 进位 加 法 ) 等 指令 。 

指令 集 的 一 个 重要 特性 是 ， 应 该 能 操作 更 长 的 整数 。 通 常 的 做 法 是 写 一 个 操作 长 整数 的 子 程 
序 ， 这 其 中 需要 用 到 一 个 类 似 ADC 的 操作 码 ， 即 能 够 将 两 个 操作 数 与 之 前 加 法 操作 的 进位 位 
(Carry) 相 加 。 

另外 ，x86 还 设计 了 和 针对 每 一 种 数据 类 型 的 操作 码 集 。 例 如 ， 多 媒体 指令 集 ( 即 MMX 指 令 )， 
它 与 我 们 通常 使 用 的 算术 运算 不 同 ， 它 能 执行 饱和 算术 运算 (saturating arithmetic)， 如 PADDS 能 
”对 两 个 操作 数 做 饱和 算术 运算 。 

饱和 算术 运算 的 含义 是 : 假设 我 们 用 数字 0 到 9 代表 一 个 元 素 的 灰 度 ，0 代 表白 色 ，9 代 表 黑 色 。 
如 果 我 们 希望 添加 一 些 黑 色 到 已 经 有 灰 度 的 数字 上 ， 例 如 一 个 元 素 初 始 值 为 灰 度 7， 然 后 对 其 添加 
5 级 灰 度 。 采 用 正常 的 算术 运算 ， 结 果 是 7+5=2 ( 带 一 个 进位 )。 这 个 结果 竟然 比 7 或 5 还 小 ， 一 定 出 
什么 问题 了 ! 但 在 饱和 算术 运算 方式 下 ， 得 到 的 结果 却 是 9， 即 最 大 饱和 值 ， 且 不 会 产生 进位 。 依 
次 ,，“7+5=9”,“9+n=9”。 饱 和 算术 运算 是 一 种 特殊 的 运算 ，x86 的 MMX 指 令 就 是 这 样 一 种 操 
作 码 。 

此 外 ， 科 学 计算 类 程序 需要 的 是 能 够 操作 浮 点 数 的 操作 码 。 如 x86 指 令 系统 中 的 FADD、 
FMUL、FSIN、FSQRT 等 指令 。 

有 关 逻 辑 运算 指令 ，AND 和 NOT 是 LC-3 仅 有 的 两 个 逻辑 运算 操作 码 。 当 然 ， 你 可 以 基于 这 两 
个 操作 码 ， 创 建 任意 的 逻辑 表达 式 。 然 而 ， 同 算术 运算 指令 一 样 ， 这 也 是 非常 耗 时 的 。 而 x86 则 拥 
有 更 多 的 专用 逻辑 运算 指令 ， 如 OR、XOR、AND-NOT 竺 指令 ， 以 及 针对 不 同 数据 类 型 的 逻辑 操 
作 码 。 

此 外 ，x86 有 许多 其 他 的 指令 ， 可 以 设置 和 清除 寄存 器 ， 将 一 个 数值 从 一 种 类 型 转换 成 另 一 种 
类 型 ， 能 够 实现 移 位 ， 或 者 旋转 一 个 数据 元 素 的 位 ， 等 等 。 

表 B-1 列 出 了 一 些 x86 指 令 集 中 的 操作 码 。 

4. 数据 搬移 指令 

LC-3 的 数据 搬移 指令 有 7 条 : LD、LDI、ST、STI、LDR、STR 和 LEA。 除 LEA 是 将 地 址 值 装 
入 寄存 器 之 外 ， 其 他 指令 都 是 在 内 存 (或 内 存 映 射 的 设备 寄存 器 ) 和 8 个 通用 寄存 器 (RO-R7) 之 
间 拷 贝 数据 。 


356 MRB 





而 x86 除 以 上 指令 之 外 ， 还 包括 更 多 的 数据 搬移 类 指令 。 如 XCHG 用 来 交换 两 个 地 址 中 的 内 
容 ， PUSHA 将 8 个 通用 寄存 器 全 部 压 人 堆栈 ，IN 和 OUT 专用 于 IO 地 址 空间 访问 ， 即 在 设备 输入 / 输 
出 端口 和 处 理 器 之 间 传 递 数 据 ，CMOYVcc 是 条 件 执行 (C) 的 数据 搬移 (MOV) 指令 ， 即 只 在 之 
前 计算 条 件 (cc) 为 真 时 ， 才 执行 MOV 操 作 。 

表 B-2 列 举 了 部 分 x86 指 令 集中 的 数据 搬移 指令 。 


表 B-1 x86 的 运算 操作 类 指令 








指 令 含义 

ADC xy x、y 和 进位 位 (CF) Hm, RAx 

MUL x 寄存 器 EAX 内 容 与 x 相 乘 ，64 位 结果 存放 在 EDX、EAX 之 中 

SAR x x 算术 右 移 n 位 ， 结 果 存 回 x。 其 中 n 的 数值 可 以 是 1、 立 即 数 或 CL 寄存 器 的 值 

XOR x,y X 和 y 的 异 或 运算 ， 结 果 存 回 x 

DAA 两 个 十 进 制 数 相 加 (两 个 BCD 编 码 数值 事先 存放 在 AL 寄存 器 中 ) 。 由 于 进 
位 门限 是 15 而 不 是 9， 所 以 结果 可 能 不 正确 。 而 DAA 能 纠正 两 个 BCD 数 字 

FSIN 栈 顶 内 容 弹 出 (假设 称 之 为 x) ， 之 后 做 sin(*) 运 算 并 将 结果 压 回 栈 

FADD 栈 顶 的 两 个 元 素 被 弹出 ， 相 加 并 将 结果 压 回 栈 

PANDN x,y 两 个 MMX 数 x 和 y， 与 非 运算 (AND-NOT)， 将 结果 存 回 x 

PADDS x,y 两 个 MMX 数 x 和 y， 饱 和 加 法 和 运算， 结果 存 同 x 





表 B-2 x86 的 数据 搬移 指令 





指令 à ox 

MOV x,y 将 y 的 内 容 找 贝 到 x 中 

XCHG x,y x 和 y 相 互 交换 内 容 

PUSHA 将 所 有 (ALL) 寄存 器 压 和 人 堆栈 . 

MOVS 将 DS 段 偏 移 ESI 处 的 数据 拷贝 到 ES 段 偏 移 EPI 处 ， 且 在 拷贝 完成 之 后 ， 同 时 
增 量 ESI 和 EDI 

REP MOVS 反复 (Repeat) 执行 MOVS 操 作 。 每 执行 一 次 MOV 操 作 ，ECX 减 1， 直 到 
ECX = 0。( 该 指令 可 用 于 拷 员 字符 串 ， 将 ECX 内 容 初 始 化 为 字符 串 长 度 ) 

LODS 将 DS 段 ESI 指 向 的 数据 装 入 EAX， 并 根据 当前 DF 标志 ， 对 ESI 做 递增 或 递减 
操作 (DF:Descend/Forward) 

INS 将 DX 寄存 器 指定 的 端口 内 容 装 入 EAX 寄 存 器 或 AX 或 AL， 取 决 于 数据 宽度 
是 32、16 或 8 位 

CMOVZ x.y 条 件数 据 搬移 指令 。 如 果 条 件 位 ZF=1， 则 将 y 内 容 拷贝 至 zx， 如 果 ZF=0， 则 
该 指令 作废 〈 如 同 执行 no-op 指 令 一 样 ) 

LEA x,y 将 y 的 地 址 (而 不 是 内 容 ) 存 人 x。 该 指令 同 LC-3 的 LEA 指 令 相似 





表 B-3 x86 的 控制 类 指令 





指 令 含 X 

JMP x 将 地 址 x 装 入 IP 寄 存 器 。 该 指令 同 LC-3 的 JMP 指 令 相 似 

CALL x 将 下 内 容 压 栈 ， 并 将 IP 内 容 替 换 为 x 

RET 堆栈 内 容 弹 出 ， 并 将 弹出 内 容 的 值 装 人 IP 

LOOP x 循环 指令 。 将 ECX 减 1， 如 果 ECX 非 0 且 ZF = 1， 则 将 x 装 入 IP 

INT n 软件 中 新 指令 。N 代 表 操作 系统 中 服务 程序 的 索引 号 。 该 指令 是 将 第 n 个 服 


务 程序 的 入 口 地 址 装 人 耻 。 该 指令 同 LC-3 的 TRAP 指 令 相 似 


5. 控制 指令 
LC-3 有 5 个 控制 指令 ， BR、JSR/JSRR、JMP、RTI 和 TRAP。 相 比 之 下 ，X86 的 控制 指令 数目 


AKLC-3 EI)x86 


更 多 ， 表 B-3 列 出 了 x86 指 令 集 的 部 分 控制 指令 。 

6. 两 地 址 与 三 地 址 的 比较 

LC-3 属 于 三 地 址 类 型 的 指令 集 ， 即 ADD 指 令 所 显 式 要 求 的 操作 数 数目 为 三 个 。 加 法 操作 需要 
两 个 源 操作 数 (要 相 加 的 数 ) 和 一 个 目的 操作 数 (存放 结果 )。 由 于 在 LC-3 中 ， 这 3 个 操作 数 必须 
显 式 指定 ， 因 此 称 为 三 地 址 指令 集 。 

注意 ， 即 使 源 操作 数 之 一 与 且 标 操作 数 是 同一 个 地 址 ， 也 需要 在 指令 中 明确 标注 3 个 地 址 。 例 
如 ， 在 LC-3 格 式 的 ADD R1,R1,R2 指 令 中 ，R1 既 是 源 地 址 也 是 目标 地 址 。 

而 x86 则 是 一 种 两 地 址 类 型 的 指令 集 。 在 x86 中 ， 加 法 操作 同样 需要 3 个 操作 数 ， 但 源 操作 数 
之 一 的 地 址 必须 同时 扮演 目的 地 址 〈 即 存放 结果 )。 例 如 ， 在 x86 中 ， 相 应 的 ADD 指 令 如 ADD 
EAX,EBX (EAX 和 EBX 是 8 个 通用 寄存 器 中 的 两 个 的 名 字 )， 则 EAX 和 EBX 是 源 操作 数 ， 而 目的 
操作 数 也 是 EAX。 由 于 操作 结果 被 存储 在 最 初 的 源 地 址 中 ， 就 意味 着 一 旦 指令 执行 之 后 ， 该 源 操 
作 数 将 被 覆盖 。 所 以 ， 如 果 源 操作 数 在 当前 指令 之 后 还 需要 ， 那 么 必须 在 指令 执行 之 前 将 其 妥善 
保存 。 

7. 内 存 操作 数 

LC-3 指 令 集 与 x86 指 令 集 最 主要 的 区 别 之 一 ， 就 是 操作 数 的 来 源 限制 。 在 LC-3 运 算 指 令 中 ， 操 
作 数 必须 来 自 寄存 器 ， 且 结果 也 必然 写 人 寄存 器 。 而 在 x86 指 令 中 ， 操 作 数 既 可 以 来 自 寄存 器 也 可 
以 来 自 内 存 ， 且 人 允许 结果 也 写 回 内 存 。 换 名 话说 ，x86 可 以 在 一 条 指令 中 完成 从 内 存 中 读 取 数值 ， 
然后 运算 操作 该 数值 ， 且 最 终 又 将 结果 写 回 内 存 等 一 连 串 操作 (这 是 LC-3 无 法 做 到 的 )。 

若 要 完成 同样 任务 (如 上 所 述 )， 在 LC-3 程 序 中 则 需要 多 条 指令 才能 完成 。 即 先是 通过 lo0ad 指 
令 将 其 从 内 存 读 人 某 个 寄存 器 ， 然 后 对 其 运算 ， 并 将 结果 存放 在 某 个 寄存 器 中 ， 最 后 再 通过 store 
指令 将 结果 写 回 内 存 。 我 们 称 具 有 这 种 特性 〈 即 对 操作 数 来 源 有 限制 ) 的 指令 集 (如 LC-3) 为 
“ioad-store” 类 型 指令 集 ， 显 然 x86 不 是 load-store 类 型 指令 集 。 


B.1.2 内 存 空间 


LC-3 的 空间 内 存 有 2' 个 地 址 ， 而 每 个 地 址 中 包含 的 信息 位 宽度 也 是 16 位 。 之 所 以 称 “LC-3 具 
有 16 位 的 地 址 空间 ”， 是 因为 16 位 地 址 可 以 独立 寻 址 2 个 内 存 位 置 。 之 所 以 称 “LC-3 的 寻 址 有 16 位 
寻 址 能 力 ”， 是 因为 其 中 的 每 个 内 存 地 址 中 包含 的 信息 宽度 是 16 位 。 

我 们 称 “x86 内 存 拥有 32 位 的 地 址 空间 和 8 位 寻 址 能 力 ”。 由 于 每 字 节 包含 8 个 bit， 我 们 又 称 
x86 是 “ 字 节 寻 址 ”。 由 于 每 字 节 宽度 是 8 位 ， 即 每 个 地 址 仅 包含 8 位 ， 那 么 内 存 中 连续 的 4 个 单元 可 
以 存放 一 个 32 位 的 数据 。 假 设 它们 的 地 址 分 别 为 X、X+1、X+2 和 X+3， 我 们 称 该 32 位 数据 单元 的 
地 址 是 X。 该 32 位 数值 中 各 bit 信 息 的 分 布 是 ，X 仅 仅 包含 其 [7:0] 位 ，X+1 包 含 [15:8] 位 ，X+2 包 含 
[23:16] 位 ，X+3 包 含 [31:24] 位 。 

基于 LC-3 的 三 种 寻 址 模式 ， 我 们 总 可 以 从 LC-3 指 令 的 地 址 信息 ， 推 算出 实际 的 内 存 地 址 。 相 
比 之 下 ，x86 指 令 则 提供 了 多 达 24 种 用 于 推算 内 存 地 址 的 寻 址 模式 (参见 B.2 节 中 的 x86 寻 址 模式 ) 。 

除 寻 址 模式 很 多 之 外 ，x86 内 存 寻 址 中 还 存在 一 种 “ 段 (segmentation) 机 制 *， 段 是 一 种 能 保 
护 特定 内 存 地 址 区 域 的 机 制 ， 如 能 防止 非法 访问 。 在 这 种 情况 下 ， 特 定 寻 址 模式 所 产生 的 地 址 不 
再 是 简单 的 直接 地 址 ， 而 是 某 个 内 存 段 中 的 偏 移 地 址 。 对 该 地 址 的 访问 ， 受 控 于 对 应 段 寄 存 器 的 
访问 控制 权限 。 有 关 保 护 机 制 的 工作 原理 ， 参 见 后 面 章节 。 

图 B-2 分 别 描述 了 在 LC-3 和 x86 段 机 制 下 ,， “FERMA” (Register + offset) 寻 址 模式 的 地 
址 计算 过 程 。 两 者 的 操作 目的 都 是 将 内 存 数据 拷贝 到 通用 寄存 器 ，LC-3 使 用 LDR 指 令 ， 而 x86 使 用 
MOV 指 令 。 在 x86 的 地 址 计算 中 ， 目 标 地 址 位 于 内 存 的 DS 区 段 ， 即 必须 通过 DS 寄存 器 来 访问 。 通 
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过 一 个 16 位 段 选择 器 (selector) 索引 段 描述 符 表 ， 获 取 该 段 对 应 的 段 描述 符 (segment descriptor), 
该 段 摘 述 符 中 包含 了 段 基 址 寄存 器 (segment base register)、 段 上 限 寄 存 器 (segment limit register) 
以 及 该 段 的 保护 信息 。 直 接 从 指令 寻 址 模式 推算 出 来 的 内 存 地 址 ( 即 偏 移 ) 与 段 基 址 寄存 器 内 容 
相 加 ， 从 而 计算 出 实际 内 存 地址 ， 如 图 B-2 所 示 。 

LC-3 指 令 基地 址 ”地 址 偏 移 





寻 址 模式 选 
FRM ( 寄 
X86 指令 存 器 /内 存 ) 4-byte 地 址 偏 移 


段 基 址 寄存 器 


段 上 限 寄 存 器 





图 B-2 LC-3 和 X86 结 构 的 “寄存 器 + 偏 移 ” 寻 址 模式 的 比较 


B.1.3 内 部 状态 

所 谓 内 部 状态 ， 是 指 LC-3 中 由 8 个 16 位 通用 寄存 器 (R0 到 R7)、1 个 16 位 PC 寄存 器 和 1 个 16 位 
PSR 寄 存 器 (特权 模式 、 优 先 级 和 3 个 N/Z/P) 组 成 的 状态 集合 。 同 样 ，x86 中 ， 用 户 可 见 的 内 部 状 
态 包括 应 用 程序 可 见 的 寄存 器 、 指 令 指 针 、 标 志 寄存 器 和 段 寄 存 器 等 。 


MLC-3 £[x86 359 


1. 应 用 程序 可 见 的 寄存 器 
图 B-3 显 示 的 是 在 x86 指 令 集中 应 用 程序 可 见 的 部 分 寄存 器 (Application-Visible Registers ) 。 





通用 寄存 器 GPR 

AL = EAX [7:0] 

DL = EDX [7:0] 

CL = ECX [7:0] 

BL = EBX [7:0] 

AH = EAX [15:8] 

DH = EDX [15:8] 

CH= ECX [15:8] 

BH = EBX [15:8] 

浮 点 寄存 器 MMX 寄存 器 
63 0 63 0 

FPO MMO 
FP1 MM1 
FP2 MM2 
FP3 MM3 
FP4 MM4 
FP5 MM5 
FP6 MM6 
FP7 MM7 


图 B-3 x86 中 应 用 程序 可 见 的 一 些 寄存 器 


同 LC-3 的 RO~R7 寄 存 器 相似 ，x86 也 有 8 个 通用 寄存 器 ， 即 EAX、EBX、ECX、EDX、ESP、 
EBP、ECI 和 EDI 等 。 每 个 寄存 器 的 宽度 都 是 32 位 ， 即 通常 情况 下 操作 数 的 大 小 为 32 位 。 但 是 ， 由 
于 x86 还 提供 了 处 理 16 位 操作 数 和 8 位 操作 数 的 指令 ， 按 道理 它 也 应 该 提供 16 位 和 8 位 的 寄存 器 ， 事 
实 上 ， 指 令 集 对 每 个 32 位 寄存 器 的 低 16 位 ， 以 及 低 16 位 中 的 低 8 位 和 高 8 位 也 分 别 做 了 标识 。 换 句 
话说 ，x86 还 提供 了 16 位 和 8 位 宽度 的 寄存 器 。 如 AX、BX 和 DI 就 是 16 位 的 寄存 器 ， 而 AL、BL、 
CL、DL、AH、BH、CH 和 DH 则 是 8 位 寄存 器 。 

另外 ，x86 还 提供 了 一 些 64 位 寄存 器 ， 用 来 存放 浮 点 数 和 MMX 计 算 需 要 的 数值 。 它 们 分 别 是 
FP0~FP7 和 MM0~MMI7。 

2. 系统 寄存 器 

所 谓 系统 寄存 器 (System level Registers)， 就 是 那些 只 有 在 特权 模式 下 (如 操作 系统 运行 时 ) 
才 可 见 的 寄存 器 。LC-3 有 两 个 系统 级 寄存 器 ， PC 和 PSR。 在 x86 下 ， 用 户 可 见 的 系统 寄存 器 也 有 类 
似 的 寄存 器 ， 甚 至 更 多 。 | 

图 B-4 给 出 了 x86 指 令 集 中 用 户 可 见 的 一 些 系统 寄存 器 。 

3. 指令 指针 

x86 有 与 LC-3 的 16 位 程序 计数 器 (PC) 完全 等 价 的 寄存 器 ，x86 称 之 为 指令 指针 (Instruction 
Pointer, IP) 。 由 于 x86 的 地 址 空间 是 32 位 的 ， 所 以 IP 寄 存 器 也 是 32 位 的 。 

4. 标志 寄存 器 

与 LC-3 的 N、Z、P 条 件 码 相 比较 ，x86 有 1 个 1 位 的 SF (sign flag) 寄存 器 和 1 个 1 位 的 ZF (zero 
flag) 害 存 器 。SF 和 ZF 的 功能 分 别 对 应 LC-3 的 N 和 Z 条 件 码 。 在 x86 中 ， 没 有 和 ELC-3 的 P 条 件 码 等 价 


360 B RB 


的 寄存 器 。 事 实 上 ，P 条 件 码 确实 是 多 余 的 ， 因 为 如 果 知 道 N 和 Z 的 值 ， 自 然 就 知道 了 P 的 值 。 但 是 ， 
为 了 方便 汇编 程序 员 和 编译 器 开发 者 ， 我 们 还 是 将 其 包含 在 LC-3 的 指令 集中 。 


31 0 
memegem[ — | 
0 
pe] [cF] 





15 
FLAGS 寄 存 器 |_ | |Pw [or[pr[w]|re]se|ze| [ar] | 


段 寄 存 器 (选择 器 ) CS 


图 B-4 x86 系 统 寄存 器 


此 外 ， 除 了 N 和 Z 以 外 ，x86 还 提供 了 更 多 的 1 位 宽度 的 标志 位 (flag)， 它 们 被 包含 在 一 个 名 为 
FLAGS 的 16 位 标志 寄存 器 (FLAGS Register) 中 。 其 他 标志 位 的 讨论 ， 参 见 后 面 内 容 。 

CF 标志 位 存放 的 是 之 前 上 一 个 相关 指令 产生 的 进位 (carry)。 正 如 之 前 ADC 指 令 描述 中 所 提 
到 的 ，CF 的 存在 使 得 软件 可 以 运算 处 理 超过 指令 集 规定 长 度 的 大 整数 。 

OF 标志 则 用 于 存放 上 一 个 指令 运算 产生 的 超出 存储 宽度 的 有 效 位 数 ， 即 OF 标志 存放 的 是 溢出 
位 (overflow)。 参 见 2.5.3 中 有 关 溢 出 的 讨论 。 

DEF 标志 字符 串 操作 的 方向 (direction)。 如 果 DF = 0， 字 符 串 操作 从 高 地 址 字 节 开 始 ( 即 指针 
字符 串 ， 记 录 下 一 个 被 操作 字符 的 指针 是 递减 的 ) 。 如 果 DEF = 1， 则 字符 串 操作 从 低地 址 字 节 开始 
( 即 字符 串 指针 是 递增 的 ) 。 

另外 ， 还 有 两 个 通常 不 被 认为 属于 应 用 程序 状态 的 标志 位 : IF (中 断 ) 标志 和 TF (KA) 标 
志 。 两 者 的 功能 你 应 该 是 熟悉 的 ，IF 的 功能 和 8.5 节 的 KBSR 和 DSR 寄 存 器 中 的 IE (interrupt enable) 
标志 类 似 。 如 果 IF= 1， 即 允许 处 理 器 接收 外 部 中 断 (比如 键盘 输入 )。 如 果 IF = 0， 外 部 中 断 将 不 
会 “打扰 ”当前 执行 的 进程 ， 我 们 称 之 为 “中 断 关 闭 ” 状 态 。 

TEF 标 志和 LC-3 仿 真 器 中 的 单 步 模式 (single-step mode) 也 非常 类 似 ， 且 仅 在 此 方式 下 ， 我 们 
才 认 为 它 属 于 指令 集 定义 。 如 果 TEF = 1， 处 理 器 在 每 执行 完 一 条 指令 之 后 ， 就 会 中 止 (并 陷入 )， 
借 此 机 会 可 以 检查 系统 状态 。 如 果 TF = 0， 处 理 器 就 会 跳 过 陷阱 (trap) ， 继 续 下 一 条 指令 的 执行 。 

5. 段 寄存 器 

在 保护 模式 (protected mode) 下 ， 指 令 计算 出 来 的 地 址 事实 上 只 是 相对 某 个 段 起 始 地 址 的 一 
个 偏 移 量 ， 而 该 段 起 始 地 址 则 由 对 应 的 段 基 址 寄存 器 (segment base register) 所 指定 。 段 基 址 寄存 
器 是 数据 段 描述 符 (data segment descriptior) 结构 的 各 个 字段 之 一 ， 而 “ 段 描述 符 ” 又 是 集中 存放 
在 “ 段 描述 符 表 ”(segment descriptor table) 中 的 。 在 任意 时 刻 ， 所 有 这 些 段 中 总 有 六 个 是 处 于 活 
动 状态 的 ， 它 们 分 别 是 代码 段 (CS), HRA (SS) 和 4 个 数据 段 (DS、ES、FS 和 GS)。 六 个 活动 
段 分 别 通 过 图 B-4 所 示 的 段 寄 存 器 来 访问 ， 这 些 段 寄存 器 中 ， 包 含 的 是 指向 对 应 段 描述 符 的 指针 。 


B.2 x86 指 令 的 格式 和 规格 说 明 


LC-3 指 令 的 长 度 是 固定 的 16 位 。 其 中 ，[15:12] 位 是 操作 码 ， 余 下 12 位 的 含义 随 操作 码 的 不 同 
而 不 同 。 
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而 x86 指 令 的 长 度 是 不 固定 的 ， 不 同 的 指令 有 不 向 的 字 节 长 度 ， 因 而 一 个 x86 指 令 可 以 包含 很 
多 信息 。 图 B-5 所 示 是 一 个 x86 指 令 的 格式 ， 该 指令 长 度 为 15 个 字 节 。 


| Prefixes | Opcode [Mod RM | SIB | 偏 移 [Immediate, 












长 度 为 0~4 字 节 TEHO, 1, 28 EEAO, 1. 2 
的 prefix ( 见 表 4 字 节 的 地 址 偏 或 4 字 节 的 立即 
B-4) 移 ， 由 ModR/M 数 ， 由 opcode 字 


字段 内 容 指定 。 段 内 容 指定 


( 见 表 B-5) ( 见 表 B-6) 


图 B-5 x86 指 令 格式 

x86 指 令 中 的 两 个 关键 部 分 是 : 操作 码 和 ModR/M 字 节 。 操 作 码 定义 了 指令 的 操作 功能 ， 
ModR/M 字 节 则 规定 了 如 何 能 够 获得 操作 数 。ModR/M 字 节 定 义 了 寻 址 模式 、 使 用 的 寄存 器 和 偏 移 
量 (1、2 或 4 字 节 )。 有 关 寄 存 器 的 具体 信息 ， 被 编码 在 1 个 SIB 字 节 中 。SIB 字 布 和 偏 移 量 (如果 需 
要 的 话 ) 都 跟 在 指令 中 ModR/M 字 节 的 后 面 。 

有 些 操作 码 是 对 立即 数 操作 的 ， 并 规定 了 指令 中 用 来 存放 立即 数 的 字 节 数 。 如 果 存 在 立即 数 ， 
则 它 的 内 容 被 存放 在 指令 的 最 后 。 

最 后 ， 指 令 中 还 定义 了 如 地 址 大 小 、 操 作 数 大 小 、 所 使 用 的 段 等 默认 信息 。 如 果 希 望 改变 这 
些 默认 信息 ， 可 以 通过 在 指令 头 部 添加 一 个 或 多 个 前 组 (prefix) 的 方式 ， 来 表示 对 这 些 默 认 信 息 
的 修改 。 

下 面 将 在 B.2.1~B.2.6 中 ， 详 细 讨 论 x86 指 令 的 各 个 字段 。 


B.2.1 前 组 

前 缀 (Prefix) 提供 了 用 于 指令 处 理 的 额外 信息 。 前 组 信息 有 4 类 ， 根 据 指令 需求 的 不 同 ， 一 
条 指令 的 前 绥 长 度 可 以 是 0~4 个 。 换 句 话 说， 前 缓 起 到 了 重新 定义 (更 准确 地 说 ， 应 该 是 “扩展 ”) 
指令 的 目的 。 

4 类 前 缀 分 别 是 锁 与 重复 (lock & repeat)、 段 重 载 (segment override), 、 操 作 数 重 载 (operand 
override) 和 地 址 重 载 (address override) 。 表 B-4 是 4 种 前 绥 的 详细 描述 。 


表 B-4 x86 指 令 集 的 指令 前 绥 


重复 / 锁 (Repeat/Lock) 


xFO(LOCK) 该 前 缀 确保 在 当前 指令 完成 之 前 ， 共 享 内 存 不 能 被 共享 
( 即 独占 ) 
xF2,XF3(REP/REPE/REPNE) 该 前 绥 表 示人 允许 当前 指令 〈 如 字符 串 操 作 指令 》 重复 执 
行 ， 重 复 次 数 由 ECX 寄 存 器 指定 。 另 外 ， 也 可 以 指定 该 重 
复 执行 在 特定 ZF 标 志 值 中 止 
段 重 载 (Segment override) 
x2E(CS),x36(SS), 该 前 缀 指定 指令 使 用 特定 段 (而 不 是 默认 段 ) 访问 内 存 
x3E(DS),x26(ES), 


X64(FS),x65(GS) 


操作 数 重 载 (Operand size override) 
x66 该 前 组 指定 数据 长 度 。 换 多 话说 ， 如 果 上 默认 数据 长 度 为 


32 位 的 数据 操作 指令 ， 则 可 以 通过 该 前 级 操作 16 位 数 。 疗 
样 ，16 位 数 操作 指令 也 可 以 通过 前 组 操作 32 位 数据 
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(X) 





地 址 重 载 (Address size override) 
x67 该 前 级 能 改变 操作 数 地 址 的 预定 大 小 。 换 句 话 说 ， 默 认 
地 址 长 度 为 32 位 的 数据 访问 指令 可 以 使 用 16 位 地 址 。 同 样 ， 
默认 地 址 长 度 是 16 位 的 指令 也 可 以 操作 32 位 地 址 


B.2.2 操作 码 


操作 码 (Opcode) 字段 (1 个 或 2 个 字 古 ) 规定 了 指令 功能 等 很 多 信息 。 操 作 码 字段 定义 了 指 
令 的 具体 操作 功能 ， 以 及 操作 数 是 从 内 存 还 是 寄存 器 中 获得 、 操 作 数 大 小 、 源 操作 数 是 否 是 立即 
数 及 立即 数 大 小 等 信息 。 

有 些 操作 码 还 要 借用 ModR/M 字 段 的 位 置 ， 即 操作 码 字段 和 ModR/VM 字 段 [53:3] 合 在 一 起 构成 操 
作 码 (当然 ， 此 时 ModR/M 字 段 不 再 代表 地 址 模式 信息 )。 有 关 ModR/M 字 段 的 描述 ， 参 见 B.2.3 市 。 


B.2.8 ModR/M 字 节 


如 图 B-5 所 示 ，ModR/M 字 段 在 需要 时 将 提供 1 或 2 个 操作 数 的 寻 址 模式 信息 。 如 果 指 令 需 要 两 
个 操作 数 ， 那 么 其 中 一 个 可 能 在 内 存 ， 另 一 个 可 能 在 寄存 器 中 ， 或 者 两 者 都 在 寄存 器 中 。 如 果 只 
需要 一 个 操作 数 ， 则 可 能 是 寄存 器 也 可 能 是 内 存 。 通 过 ModR/M 字 段 (R/M-Reg/Mem) 的 标识 ， 
以 上 各 种 组 合 方式 都 可 以 被 识别 。 

ModR/M 字 段 可 以 划分 为 两 部 分 , 其 中 ,第 一 部 分 由 [7:6] 和 [2:0] 位 组 成 , 第 二 部 分 由 [5:3] 位 组 成 。 

如 果 [7:6] 位 = 00、01 或 者 10， 即 意味 着 第 一 部 分 标识 内 存 操作 数 的 寻 址 模式 ， 即 [7:6] 和 [2:0] 
组 合 在 一 起 的 5 位 ， 标 识 了 具体 的 寻 址 模式 。 如 果 [7:6] 位 = 11， 则 表示 没有 内 存 操作 数 ， 此 时 [2:0] 
位 代表 的 是 一 个 寄存 器 操作 数 。 

如 果 指 令 需 要 两 个 操作 数 ， 则 [5:3] 位 表示 另 一 个 操作 数 的 寄存 器 编号 。 如 果 指 令 只 需要 一 个 
操作 数 ， 则 [5:3] 位 将 作为 操作 码 字 段 的 补充 码 (sub opcode), ， 用 来 区 分 操作 码 字段 内 容 完全 相同 
的 8 种 指令 ， 参 见 B.2.2 节 所 述 。 

表 B-5 列 举 了 ModR/M 字 段 的 含义 。 


表 B-5 ModR/M 字 段 及 其 例子 


Mod Reg R/M Eff.Addr Reg &'Xx 

00 011 000 [EAX] EBX EAX 包含 的 是 内 存 操作 数 的 地 址 ，EBX 
是 寄存 器 操作 数 

01 010 000 dispB[EAX] EDX EAX 内 容 和 指令 中 的 偏 移 量 字段 相 加 ， 
求 得 内 存 操 作 数 的 地 址 ，EDX 包 含 寄 存 器 
操作 数 

10 000 100 disp32[-][-] EAX 将 4 字 节 (32 位 ) 仿 移 量 和 SIB 字 段 指 定 
的 内 容 相 加 ， 获 得 最 终 的 内 存 操作 数 地 址 ， 
EAX 是 寄存 器 操作 数 

11 001 110 ESI ECX 如 果 指 令 需 要 的 两 个 操作 数 都 来 自 寄存 器 


(如 ESI 和 ECX)， 如 果 指 令 只 需要 一 个 操作 
数 ， 则 它 在 ESI 中 ， 那 么 此 时 001(bits[5:3]) 作 
为 操作 码 的 子 码 
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表 B-6 SIB 字 段 ( 字 节 ) 及 其 例子 

Scale Index Base Computation 含 x 

00 011 000 EBX+EAX EBX 内 容 与 EAX 相 加 ， 再 将 相 加 的 结果 
同 ModR/M 指 定 的 内 容 相 加 

OI 000 001 2xEAX«-ECX EAX 乘 2 与 ECX 内 容 相 加 ， 再 与 ModR/M 
指定 的 内 容 相 加 

01 100 001 ` ECX 将 ECX 内 容 同 ModR/M 指 定 的 内 容 相 加 

10 110 010 4x ESI-EDX ESI 乘 4 与 EDX 的 内 容 相 加 ， 再 与 
ModR/M 指 定 的 内 容 相 加 

B.2.4 SIB 字 节 


如 果 指 令 操作 码 定义 了 从 内 存 中 读 取 操作 数 ， 则 由 ModR/M 字 段 指 定 具体 的 寻 址 模式 ， 即 有 关 
操作 数 地 址 的 计算 信息 。 但 是 ， 有 些 寻 址 模式 超出 了 ModR/M 字 段 所 能 定义 的 范围 ， 那 么 这 些 操作 
数 的 定义 (如 表 B-5 中 第 3 个 例子 ) 还 有 赖 于 SIB 字 段 信息 。SIB 字 段 定义 了 一 种 更 灵活 的 “比例 
索引 - 基 址 ”(scale-index-base) 计算 方式 ， 图 B-5 所 示 是 比例 参数 、 索 引 寄 存 器 和 基 址 寄存 器 。 
SIB 的 计算 方式 是 “scale x index + base”， 其 中 base 和 index 人 允许 为 0，scale 人 允许 为 1。 表 B-6 是 对 SIB 


字段 的 描述 。 
B.2.5 WBR 


如 果 ModR/M 字 段 指明 地 址 计算 需要 偏 移 量 信息 ， 那 么 这 个 偏 移 量 (可 能 是 1、2 或 4 字 节 ) 必 
然 包含 在 当前 指令 中 。 偏 移 量 所 占 的 具体 字 节 数 ， 由 操作 码 或 ModR/M 字 段 指 定 。 

图 B-6 所 示 描 述 了 图 中 例子 指令 的 寻 址 模式 及 其 地 址 计算 过 程 。 前 缀 x26 重 载 了 段 寄存 器 ， 即 
指定 使 用 ES 段 。 这 是 一 条 内 存 操作 数 和 寄存 器 操作 数 的 求 和 (ADD) 运算 指令 ， 其 中 ModR/M 和 
SIB 字 节 的 信息 ， 表 示 了 内 存 操作 数 的 地 址 计算 模式 参数 ， 即 SIB (scale x index + base) 基 址 加 偏 
移 (displacement) 的 寻 址 模式 ， 其 中 偏 移 量 大 小 是 4 个 字 节 (Mod=10) ，Scale 值 为 4 (10)， 素 引 
寄存 器 是 EBX (011)， 基 址 寄存 器 是 ECX (001), 

Prefix Opcode ModRM SIB 偏 移 


00100110 10011001 


ADD dendo []{] EBX*4«ECX 
override r32, m32 EAX 


32 bits 







EBX 


ES 段 基 址 寄存 器 


地 址 
图 B-6 “Base+Scaledindes+disp32” 寻 址 模式 的 地 址 计算 方法 
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B.2.6 立即 数 


之 前 我 们 曾 介绍 过 ，LC-3 允 许 在 指令 中 棋 入 一 个 较 Opcode ModRM —— imma 
小 的 立即 数 (通过 设置 指令 位 instf5:5j=1)。 同 样 ，x86 也 99000101 
充 许 在 指令 中 和 骨 入 立即 数 。 如 前 面 的 描述 ， 如 果 操 作 码 。 “vm 32, imm8 
指定 源 操作 数 之 一 是 立即 数 ， 必 然 也 将 指明 该 立即 数 的 
长 度 ， 即 所 占 的 字 节 数 。 因 此 ， 在 指令 中 的 立即 数 ， 可 
以 表示 成 1、2 或 者 4 字 节 。 由 于 操作 码 同时 也 定义 了 操作 
数 的 大 小 S， 因 而 实际 在 指令 中 内 修 的 立即 数 所 占 的 字 
节 数 ， 可 以 比 操作 数 大 小 要 小 ， 在 真正 运算 操作 之 前 ， 
可 以 通过 符号 扩展 (sign-extend) 的 方式 将 其 扩展 为 完 
整 大 小 。 图 B-7 显 示 了 在 ADD 指 令 中 (ADD EAX,$5), 
立即 数 操作 数 的 使 用 方法 ， 它 与 我 们 熟悉 的 LC-3 指 令 很 
相似 (如 ADD R0,R0,#5). 


B.3 例子 


我 们 用 一 个 例子 来 总 结 这 个 附录 。 问 题 是 我 们 在 第 
14 章 处 理 过 的 。 假 设 输入 的 字符 串 由 文字 、 数 字 和 标点 符号 组 成 ， 写 一 个 C 程 序 ， 转 换 所 有 的 小 写 
字母 为 大 写字 母 。 图 B-8 展 示 了 解决 这 个 问题 的 C 程 序 。 图 B-9 展 示 了 C 编 译 器 产生 的 经 过 注释 的 
LC-3 汇 编 语 言 。 图 B-10 展 示 了 相应 的 经 过 注释 的 x86 汇 编 语 言 。 为 了 可 读 性 ， 我 们 展示 的 是 LC-3 和 
x86 的 汇编 语言 程序 而 不 是 机 器 码 。 


#include <stdio.h> 


EAX 5 





图 B-7 x86 指 令 ; ADD EAX,$5 


void UpcaseString(char inputString[]); 


main () 


{ 


char string[8]; 


scanf ("%s", string); 
UpcaseString (string); 


} 


void UpcaseString(char inputString[]) 


int i = 0; 


while(inputString[i]) ( 
if (('a' <= inputString[i]) && (inputStringli] <= 'z')) 
inputString|i] = inputStringli] - ('a' - 'A'); 
i++; 
} 
} 





图 B-8 大 小 写字 符 转 换 程 序 (C 语 言 版 ) 


; uppercase: converts lower- to uppercase 


.ORIG x3000 
LEA R6, STACK 
MAIN ADD R1, R6, #3 


图 B-9 大 小 写字 符 转换 程序 (LC-3 版 ) 


O 注意 “立即 数 (或 操作 数 ) 的 大 小 ”和 “立即 数 的 长 度 ” 在 此 处 的 区 别 。 前 者 是 指 它 逻 辑 上 所 代表 的 数值 
宽度 (32 位 或 16 位 ，8 位 )， 后 者 表示 它 在 指令 中 实际 占用 的 长 度 或 宽度 。 一 一 译 者 注 


ALC-3 £[x86 


UPPERCASE 


#1 
#0 
#4 
#3 
R2 
#0 


R5， 

R4, R5 
R4, #0 
Ri, #1 
R1, R6, #4 
CONVERT 
R7, R6, #1 
R6, R6, #2 


.FILL #-97 
.FILL #-122 
.FILL #-32 


图 B-9 大 小 写字 符 转 换 程 序 (LC-35&) (4) 


.386P 
.model FLAT 


.DATA SEGMENT 


$5G397 DB 
.DATA ENDS 


'Ss', 00H 


. TEXT SEGMENT 


.String$ = -8 


main PROC NEAR 


sub 
lea 
push 
push 
call 


lea 
push 
call 


add 
ret 
ENDP 


esp, 8 

eax, DWORD PTR _ 
eax 

OFFSET FLAT:$SG3 
_scanf 


ecx, DWORD PTR — 
ecx 


_UpcaseString 


esp, 20 


0 


reád in input string: scanf 


; put in NULL char to mark the "end" 
; get the starting address of the string 
pass the parameter 


; add index to starting addr of string 
; Done if NULL char reached 


'a' <= input string 


input string «- 'z' 


convert to uppercase 


increment the array index, i 





; The NULL-terminated scanf format 
; String is ‘stored in global data space. 


Location of "string" in local stack 


; Allocate stack space to store "string" 


string$ [esp+8] 
; Push arguments to scanf 


了 


97 


string$[esp«16] 
; Push argument to UpcaseString 


; Release local stack space 





图 B-10 大 小 写字 符 转 换 程 序 (X86 版 ) 
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; "inputString" location in local stack 


 inputString$ = 8 
 UpcaseString PROC NEAR 
mov ecx, DWORD PTR (inputString$ [esp-4] 
cmp BYTE PTR [ecx], 0 
je SHORT $L404 ; If inputString[0]--0, skip the loop 
mov al, BYTE PTR [ecx] ; Load inputStringíi] into AL 
cmp al, 97 ; 
ji SHORT $L405 
al, 122 
jg SHORT $L405 
sub al, 32 
mov BYTE PTR [ecx], al 
inc ecx 
mov al, BYTE PTR [ecx) 
test al, al 
jne SHORT $L403 ; Loop if inputStringili] != 0 
$L404: ret 0 
.UpcaseString ENDP 
TEXT ENDS 
END 





图 B-10 大 小 写字 符 转换 程序 (X86 版 ) (5X) 


附录 C ”LC-3 的 微 结构 


从 第 4 章 和 第 5 章 的 学 习 中 我 们 获知 ， 计 算 机 在 处 理 指令 时 ， 每 条 指令 的 处 理 周期 事实 上 包括 
很 多 子 节拍 ， 而 这 些 节拍 及 其 之 间 的 衔接 操作 ， 是 由 一 个 微 结构 (microarchitecture) 负责 完成 的 。 
换 旬 话说 ， 如 果 将 指令 集 理解 为 硬件 与 软件 的 接口 ， 则 微 结构 就 是 接口 之 下 的 硬件 实现 。 微 结构 
必须 在 不 超过 一 条 指令 周期 长 度 的 时 间 内 ， 完 成 一 条 指令 的 所 有 具体 操作 。 本 附录 以 LC-3 为 例子 ， 
介绍 LC-3 微 结构 实现 的 方法 之 一 及 其 实现 细节 。 事 实 上 ， 微 结构 的 许多 设计 细节 、 设 计 方 案 的 选 
择 及 其 设计 理念 的 知识 ， 已 超出 入 门 课程 的 范围 。 所 以 ， 本 书 将 这 部 分 讨论 放 在 附录 中 供 你 参考 ， 
它 主 要 介绍 了 微 结 构 是 怎样 执行 LC-3 的 各 种 指令 的 。 


C.1 概述 


如 图 C-1 所 示 ， 数 据 通路 和 控制 器 是 指令 集结 构 (ISA) 中 最 重要 的 两 个 组 成 部 分 。 数 据 通 路 
包含 了 与 指令 处 理 相关 的 所 有 部 件 ， 而 控制 器 则 根据 读 入 的 指令 (主要 是 操作 码 ) 产生 用 于 控制 
数据 通路 的 信号 ， 即 “指挥 ”各 个 处 理 单元 在 “特定 时 刻 ” 做 “特定 事情 ” ， 直 至 指令 结束 。 

这 里 所 说 的 “特定 时 刻 ”， 即 指 在 每 个 时 钟 周 期 内 。 在 计算 机 术语 中 ， 我 们 通常 以 时 钟 周 期 
(clock cycle) 为 单位 (而 不 是 以 秒 为 单位 ) 计量 时 间 。 一 个 周期 时 间 (cycle time) ， 就 是 相 邻 周 
期 的 间 踊 时 间 。 在 今天 的 微 处 理 器 中 ， 一 个 周期 时 间 大 约 是 0.3ns， 换 句 话 说， 每 秒 钟 对 应 20 亿 个 
时 钟 周期 ， 再 换 种 说 法 ， 我 们 称 该 微 处 理 器 的 操作 频率 是 2GHz 。 

在 每 个 特定 时 间 内 一 一 或 者 每 个 时 钟 周期 内 ， 有 49 个 控制 信号 (如 图 C-1 所 示 ) 在 控制 着 数据 
通路 的 运转 ， 并 准备 着 下 一 时 钟 周 期 的 控制 信号 产生 。 其 中 39 个 信号 控制 着 当前 的 数据 通路 ，10 
个 信号 负责 下 一 时 钟 周 期 控制 信号 的 产生 。 

注意 ， 控 制 信号 的 产生 和 有 序 操作 是 一 个 高 度 复杂 的 工作 ， 换 句 话 说 ， 它 不 是 在 “真空 ” 
(vacuum) 完成 的 。 相 反 ， 决 定 一 个 时 钟 周 期 内 需要 产生 什么 样 的 控制 信号 ， 取 决 于 以 下 诸多 因素 : 

(1) 当前 时 钟 周期 的 工作 状态 。 

(2) 正在 执行 的 LC-3 指 令 。 

(3) 正在 运行 程序 的 权限 模式 (privilege)。 

(4) 如 果 当 前 指令 是 BR， 跳 转 条 件 ( 即 相关 条 件 码 的 值 ) 是 否 满足 。 

(5) 当前 是 否 有 外 部 设备 在 请 求 中 断 处 理 器 。 

(6) 当前 指令 的 内 存 访 问 在 本 周期 内 是 否 能 完成 。 

以 上 各 个 问题 在 图 C-1 中 都 有 答案 ， 如 下 所 述 : 

(1) 当前 时 钟 周期 所 需 的 10 个 控制 信号 是 J[5:0]、COND[2:0] 和 IRD。 

(2) 指令 中 操作 码 字段 (inst[15:12]) 确定 了 具体 的 指令 ， 而 inst[11:11] 位 则 确定 了 寻 址 模式 ， 
如 JSR 和 JSRR 之 间 ， 该 位 值 就 不 同 ， 即 寻 址 子 程序 地 址 的 方法 不 同 。 

(3) PSR[15] 即 为 处 理 器 状态 寄存 器 PSR 的 bit[15]， 标 识 了 当前 程序 的 执行 权限 (privilege) 
是 特权 级 (supervisor) 还 是 用 户 级 (user), 

(4) BEN 指 示 跳 转 (BR) 是 否 执行 。 

(5) INT 表 示 当 前 有 个 优先 级 比 执行 进程 优先 级 更 高 的 外 部 设备 ， 正 在 请 求 服务 。 
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(6) R (Ready) 表示 内 存 操 作 结束 。 








IR[15:11] 
INT R 






控制 单元 


控制 信号 


(J, COND, iRD) 





图 C-1 LC-3 微 结构 的 主要 部 件 


C.2 状态 机 


在 一 个 特定 的 时 钟 周期 内 ，LC-3 微 结构 的 行为 完全 受 控 于 49 个 控制 信号 和 9 个 额外 的 信息 位 
( 即 inst[15:11]、PSR[15]、BEN、INT 和 R)， 如 图 C-1 所 示 。 我 们 已 介绍 过 ， 其 中 的 39 个 控制 信 叶 
控制 着 当前 数据 通路 的 运行 ， 而 另外 10 个 信号 与 9 个 信息 位 ， 决 定 了 在 下 一 个 时 钟 周期 的 控制 信号 
应 该 是 什么 样 的 。 

我 们 称 这 49 个 控制 信号 定义 了 LC-3 微 结构 之 控制 结构 的 状态 (state)， 那 么 我 们 可 以 将 LC-3 微 
结构 的 行为 描述 为 一 个 有 向 图 (directed graph)， 由 节点 (node) 和 连 线 (arc) 组 成 。 其 中 ， 节 点 
即 对 应 了 每 个 状态 ， 连 线 表示 从 一 个 状态 转移 到 下 一 个 状态 ， 我 们 称 这 样 一 张 图 为 状态 机 (state 
machine), 

图 C-2 是 LC-3 设 计 实 现 所 对 应 的 状态 图 。 状 态 机 描述 了 计算 机 运行 时 ， 每 个 时 钟 周期 内 的 (处 
AR) 运行 状态 。 每 个 状态 点 对 应 一 个 时 钟 周期 反之， 每 个 时 钟 周期 内 也 只 对 应 一 个 状态 点 ， 
即 下 一 个 时 钟 周期 开始 将 转 至 下 一 个 状态 点 。 事 实 上 ， 整 个 状态 机 描述 了 一 个 指令 从 FETCH 状 态 
点 开始 ， 逐 步 (step-by-step 或 clock-cycle-by-clock-cycle) 地 操作 直至 指令 完成 的 全 过 程 (如 4.2.2 
节 的 描述 ) 。 由 于 一 条 指令 的 执行 要 经 历 多 个 时 钟 周期 ， 所 以 每 个 节点 反映 的 是 当前 周期 内 处 理 器 
的 活动 状态 (是 控制 信号 而 不 是 操作 细节 )， 真 正 的 操作 事实 上 是 由 数据 通路 部 件 完成 的 。 

首先 ， 我 们 回顾 一 下 第 4 章 中 所 介绍 的 取 指 令 (FETCH) 操作 。 每 个 指令 周期 开始 的 第 一 项 工 
作 ， 就 是 读 取 由 PC 指向 地 址 中 的 指令 。 参 见 “ 状 态 18” 中 的 注释 ， 将 PC 内 容 装 入 MAR， 同 时 
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PC+1， 为 下 一 个 取 指令 操作 做 好 准备 ， 然 后 检查 是 否 存在 中 断 请 求 (INT 标 志 )。 如 果 没 有 中 断 请 
x (INT=0)， 则 转 和 下 一 个 状态 (33) ， 如 果 有 中 断 请 求 ， 则 跳 转 至 中 断 服 务 程序 (参见 C.6 节 )。 


18 
MAR «-PC 
PC«-PC«1 
INT] 






RTI 
To8 BEN«-IR[11] & N + IR[10] & Z + IR[9] & P 
见 图 C-7 [IR[15:12]] 


1 
DRi«-SR140P2* 
set CC 
To 18 5 
DR«-SR1&OP2* 
set CC 
To18  (OR«-NOT(SR) Y 

set CC 
To 18 15 
MAR«-ZEXTIIR[7:0] 
C3 MDR«-MIMAR]- 
一 R7«-PC 
R R 
30 
PC«-MDR 
To18  "OR--PC«off9 Y^ 
set CC 


To 18 






To18 / PC--BassR ) 
R7«-PC 


To 18 





27 16 | PC«oftt : PC + SEXTIONsett1] 
set CC — | .op2 可 以 是 SR2 或 SEXTiimm5] 
R R 


To 18 


25 23 注意 : 
( ] MDR«-MIMAR] MDR«-SR B+offe : Base + SEXT[offseté] 
x 和 PC«off9 : PC + SEXT(offseto] 





To 18 


图 C-2 LC-3 状 态 机 


在 进入 状态 33 之 前 ， 我 们 先 解释 一 下 该 状态 机 的 编号 系统 ， 即 为 什么 刚才 遇 到 的 两 个 状态 的 
编号 是 18 和 33 (而 不 是 别 的 什么 数字 ) ? 回顾 一 下 第 3 章 中 有 限 状 态 机 的 介绍 ， 首 先 每 个 状态 都 必 
须 有 一 个 惟一 的 编号 ， 而 这 个 “惟一 性 ”是 通过 状态 变量 的 方式 完成 的 。LC-3 ISA 共 有 52 个 状态 ， 
图 C-2 中 标注 了 其 中 的 31 个 ， 以 及 三 个 指向 别处 〈 状 态 8、13 和 49) 的 指针 ， 图 C-7 标 注 了 另外 的 18 
个 及 其 指 回 图 C-2 的 指针 。 由 于 k 个 逻辑 变量 (T/F 或 1/0) 能 组 合 的 不 同 数值 是 个， 所 以 52 个 条 目 
需要 6 个 状态 变量 。 图 C-2 中 ， 每 个 节点 旁边 的 编号 是 二 进 制 (0/1) 状态 变量 的 十 进 制 数 ， 如 “ 状 
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态 18” 对 应 的 状态 变量 是 010010。 
现在 回 到 状态 18 结 束 后 的 场景 。 如 果 此 时 没有 外 部 设备 的 中 断 请 求 ， 则 状态 图 转移 至 状态 33。 


在 状态 33 中 ， 由 于 MAR 寄 存 器 的 内 容 是 指令 在 内 存 中 的 地 址 ， 所 以 从 MDR 中 读 出 的 内 容 就 是 该 指 
令 。 内 存 访问 需要 一 定 的 延迟 ， 所 以 该 状态 不 断 执行 ， 直 到 接收 到 来 自 内 存 的 R (Ready) 信号 
(表示 内 存 访 问 结束 ) ， 即 MDR 的 内 容 是 来 自 MAR 所 指向 内 存单 元 的 内 容 。 于 是 ， 状 态 机 转移 至 状 
态 35， 即 将 MDR 中 的 指令 再 次 搬移 至 指令 寄存 器 (instruction Register) 。 这 就 是 指令 周期 中 “ 取 
指令 ”节拍 的 全 过 程 。 


GateMARMUX -7\ 


CONTROL us 8 


N— GateALU 


I » 
x ADDR. CTL. 





图 C-3 LC-3 数 据 通 路 
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注意 状态 18 的 重要 性 ， 之 前 的 任意 指令 执行 结束 后 〈 即 不 同 指令 对 应 指令 周期 的 最 后 一 个 状 
d). ， 都 会 跳 转 至 状态 18 (下 一 个 指令 周期 的 第 一 个 状态 )。 








表 C-1 数据 通路 控制 信号 
信号 数值 
LD.MAR/1: NO,LOAD 
LD.MDR/1: NO, LOAD 
LD.IR/1: NO,LOAD 
LD.BEN/i: NO, LOAD 
LD.REG/1: NO,LOAD 
LD.CC/1: NO,LOAD 
LD.PC/1: NO, LOAD 
LD.Priv/1: NO,LOAD 
LD.SavedSSP/1: NO, LOAD 
LD.SavedUSP/1: NO, LOAD 
LD.Vector/l: NO, LOAD 
GatePC/1: NO, YES 
GateMDR/1: NO, YES 
GateALU/1: NO,YES 
GateMARMUX/1: NO, YES 
GateVector/1: NO, YES 
GatePC-1/1: NO, YES 
GatePSR/1: NO, YES 
GateSP/l: NO,YES 
PCMUX/2: PC+1 ;Select pc+l 
BUS ;Select value from bus 
ADDER ;Select output of address adder 
DRMUX/2: 11.9 ;destination IR[11:9] 
R7 ;destination R7 
SP ;destination R6 
SR1MUX/2: 11.9 ;Source IR[11:9] 
8.6 ¿source IR[8:6] 
SP ;Source R6 
ADDRIMUX/1: PC,BaseR 
ADDR2MUX/2: ZERO ;select the value zero 
offset6 ;select SEXT[IR[5:0]] 
PCoffset9 ;Select SEXT[IR[8:0]] 
PCoffsetl11 ;Select SEXT[IR[10:0]] 
SPMUX/2: SP+1 ?select stack pointer+1 
SP-1 ;Select stack pointer-1 
Saved SSP ;Select saved Supervisor Stack Pointer 
Saved USP ;select saved User Stack Pointer 
MARMUX/1: 7.0 ;select ZEXT[IR[7:0]] 
ADDER ;Select output of address adder 
VectorMUX/2: INTV 


PSRMUX/1: 
ALUK/2: 
MIO.EN/1: 


Priv.exception 
Opc.exception 

individual settings, BUS 
ADD,AND,NOT,PASSA 

NO, YES 
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( 续 ) 
信号 数值 
R.W/1: RD, WR 
Set.Priv/1: 0 ;Supervisor mode 
1 ;User mode 
C.3 数据 通路 


“数据 通路 ”(data-path) 是 指 在 一 个 指令 周期 内 ， 信 息 处 理 所 涉 及 到 的 所 有 部 件 的 总 和 ， 即 
那些 处 理 信 息 的 功能 单元 (function unit) 、 寄 存 器 (周期 结束 时 存放 处 理 结果 )， 以 及 总 线 (bus) 
和 连 线 (wire) (在 数据 通路 的 各 个 单元 之 间 传 输 信息 )。 图 C-3 所 示 的 是 LC-3 数 据 通路 的 微 结构 实 
现 ， 事 实 上 是 图 5-9 的 一 个 扩展 版 。 

在 数据 通路 中 ， 注 意 那些 与 每 个 部 件 相连 的 控制 人 号。 如 ALUK 信 号 (事实 上 是 由 2 个 控制 信 
号 组 成 的 ) 连接 的 是 ALU 部 件 。 控 制 信号 决定 了 在 一 个 周期 里 部 件 的 具体 工作 。 表 C-1 列 出 了 对 应 
数据 通路 中 各 单元 的 控制 信号 及 其 不 同 取 值 (为 了 便于 识别 ， 我 们 标识 的 是 数值 的 符号 名 ， 而 不 
是 其 真正 的 二 进 制 值 )。 例 如 ，ALUK 由 2 个 位 组 成 ， 则 它 有 4 种 可 能 值 。 在 特定 时 钟 周期 内 ， 其 具 
体 数值 取决 于 ALU 单 元 的 当前 任务 是 ADD 还 是 AND、NOT， 亦 或 只 是 简单 地 将 某 个 输入 直通 到 
ALU 输 出 端 ， 再 如 ，PCMUX 也 是 由 2 个 控制 信号 组 成 ， 它 决定 了 多 路 开关 (MUX) 的 所 有 输入 中 ， 
哪 一 个 被 选中 了 ; LD.PC 则 是 1 位 控制 信号 ， 取 值 0 (NO) 或 1 (YES)， 它 决定 了 当前 时 钟 周期 内 
是 否 装载 新 的 PC 内 容 

任意 一 个 时 钟 周期 只 对 应 状态 机 中 的 一 个 “当前 状态 ”。39 个 控制 信号 控制 着 当前 时 钟 周期 内 
所 有 数据 通路 部 件 的 工作 ， 在 一 个 时 钟 周 期 内 数据 通路 中 所 进行 的 处 理工 作 ， 如 状态 机 中 各 个 节 
点 内 所 描述 的 。 


C.4 控制 器 结构 


一 个 微 结构 的 控制 结构 对 应 着 状态 机 的 定义 。 状 态 机 (如 图 C-2 所 示 ) 决定 了 每 个 时 钟 周期 内 
的 控制 信号 输出 ， 这 些 控制 信号 控制 着 数据 通路 的 处 理 过 程 ， 并 决定 着 控制 流 (control flow) 从 
当前 状态 到 下 一 个 状态 的 跃迁 。 

图 C-4 所 示 是 LC-3 的 控制 器 结构 图 。 控 制 器 的 工作 原理 如 状态 机 所 示 ， 但 具体 实现 方法 却 有 很 
多 种 ， 最 终 的 方案 选择 ， 取 决 于 设计 时 的 综合 考虑 ， 即 计算 机 体系 结构 的 设计 评估 。 

我 们 选择 的 是 一 种 简单 的 直接 微 编程 (straightforward microprogrammed) 方法 9。 由 于 在 任 
意 状 态 下 ， 控 制 器 需要 39 个 信号 来 控制 数据 通路 的 正常 工作 ， 另 外 10 个 用 于 确定 下 一 个 状态 ， 我 
们 将 这 49 根 信号 的 集合 统称 为 微 指 令 (microinstruction) 。 换 句 话 说， 每 条 微 指 令 的 宽度 是 49 位 
(对 应 状态 机 的 一 个 特定 状态 ) 。 而 在 控制 器 内 部 有 一 个 专用 的 存储 器 即 “控制 存 储 ”(control store), 
用 来 存放 这 些 特定 的 微 指 令 ， 其 中 每 个 存储 单元 的 宽度 都 是 49 位 。 控 制 存 储 中 共有 52 个 存储 单元 ， 
对 应 状态 机 的 52 个 不 同 状态 ， 这 也 意味 着 ， 需 要 一 个 6-bit 的 地 址 来 标识 每 一 条 微 指令 。 


O 所谓 “直接 微 编程 ”方法 ， 就 是 微 指令 的 每 个 bit 对 应 一 个 控制 信号 ， 与 之 对 应 的 则 是 更 为 复杂 一 些 的 “ 间 
接 ”(indirect) 或 “多 级 微 指 令 ” 等 方法 。 如 “间接 方法 ”就 是 指 微 指令 中 的 部 分 bit 合 在 一 起 ， 再 经 过 一 
级 译 码 才 能 产生 控制 信号 (节省 空间 ， 但 一 次 只 能 产生 一 个 控制 信号 ) ， 再 如 “多 级 ”方法 ， 微 指令 格式 
同上 级 指令 格式 一 样 ， 包 括 微 操作 码 和 微 操 作 数 字段 。 一 一 译 者 注 
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(J, COND, IRD) 
图 C-4 控制 结构 的 微 编程 实现 方法 : 结构 图 


表 C-2 微 序列 器 控制 信号 





信号 名 信号 什 
J/6: 
COND/3: CONDO ;Unconditional 
CONDI ;Memory Ready 
COND2 ;Branch 
COND3 ; Addressing Mode 
COND4 ;Privilege Mode 
CONDS ;Interrupt test 
IRD/1: NO, YES 





表 C-2 所 示 ， 是 决定 状态 机 下 一 个 状态 的 10-bit 控 制 信息 ， 及 其 可 能 的 取 值 。 而 图 C-5 是 微 序列 
器 (microsequencer) 的 设计 逻辑 ， 微 序列 器 的 任务 是 基于 当前 的 10-bit 控 制 信息 ， 确 定 状态 机 的 
下 一 个 迁移 状态 ， 也 即 下 一 状态 所 对 应 的 49 位 微 指 令 的 地 址 。 

例如 ， 图 C-2 状 态 机 的 “状态 32” 有 16 个 可 能 的 “下 一 状态 ”， 具 体 迁 移 到 其 中 的 哪 一 个 状态 ， 
完全 取决 于 当前 读 人 的 指令 。 该 状态 的 任务 即 “解码 ”(DECODE) 工作 (如 第 4 章 所 述 )， 进 入 该 
状态 意味 着 控制 器 切换 至 对 应 的 微 指令 (或 新 的 一 组 控制 信号 ) 。 如 果 当 前 微 指 令 的 IRD 位 ( 即 控 
制 信号 ) 是 1， 则 切换 开关 (MUX， 如 图 C-5) 的 输出 与 左边 6 位 输入 〈( 即 由 “00” 和 指令 
IR[15:12] 这 4 位 组 装 而 成 的 6 位 ) 相连 通 。 事 实 上 ，IR[15:12] 对 应 的 就 是 当前 指令 的 操作 码 
(opcode) 字段 ( 即 LC-3 的 15 个 有 效 指令 和 1 个 未 定义 指令 操作 码 )， 那 么 由 它 组 成 的 控制 存储 地 址 
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只 有 16 种 可 能 ， 规 定 了 当前 被 处 理 的 LC-3 指 令 的 操作 码 ， 控 制 存 储 器 的 下 一 个 地 址 将 是 这 16 个 地 
址 之 一 ， 分 别 对 应 15 个 操作 码 和 1 个 未 被 使 用 的 操作 码 (BIIR[I5:12] = 1101)。 换 句 话 说， 状态 32 
之 后 的 下 一 状态 只 可 能 是 这 16 个 状态 之 一 。 假 设 以 ADD 为 例 ， 由 于 ADD 指 令 的 IR[15:12]=0001， 
所 以 它 从 状态 32 跳 转 至 的 下 一 状态 就 是 状态 1。 


COND2 COND1 CONDO 





0,0,IR[15:12] 


下 一 个 状态 的 地 址 


图 C-5 LC-3 微 序列 器 


假设 由 于 种 种 原因 ， 当 前 指令 的 IR[15:12] = 1101 ( 即 “ 无 效 指令 ”(unused opcode))， 则 微 
结构 将 跳 转 至 状态 13 所 对 应 的 微 指 令 ， 即 认为 它 是 一 个 “非法 (ilegal) 指令 ”( 具 体 细节 描述 ， 
可 参考 C.6.3 节 )。 

很 多 控制 数据 通路 和 微 序列 器 的 信号 未 在 表 C-1 和 C-2 中 列 出 ， 如 DR、SR1、BEN、INT 和 R， 
它们 需要 额外 的 逻辑 来 生成 ， 图 C-6 所 示 是 生成 信号 DR、SR1 和 BEN 的 逻辑 电路 。 

IRI11:9] IRI11:9] 


110 DR IR[8:6] SR! 
11 110 


DRMUX SR1MUX 
a) b) 
IR[11:9] 


逻辑 


c) 
图 C-6 控制 信号 逻辑 的 附加 部 件 
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INT 信 号 是 由 外 部 设备 提供 的 ， 处 理 器 如 果 收 到 这 个 信号 ， 就 要 中 断 正在 执行 的 程序 ， 转 而 处 
理 中 断 (或 称 “服务 于 ”该 中 断 )。 在 微 结构 中 ， 怎 样 妥善 处 理 中 断 是 个 很 重要 的 问题 ， 有 关中 断 
机 制 的 原理 ， 参 考 第 8 章 ， 有 关 微 结构 中 相应 的 控制 方式 ， 参 考 C.6 节 。 

R 信 号 是 一 个 同步 信号 ， 由 内 存 提供 。 设 计 该 信号 的 目的 ， 是 使 得 LC-3 能 正确 操作 内 存 。 因 为 
内 存 访问 GRS) 所 需 的 时 钟 周期 数目 不 确定 ， 而 内 存 通过 发 送 R (ready) 信号 通知 内 存 访 问 
结束 。 假 设 内 存 访 问 的 延迟 是 5 个 周期 ， 那 么 在 MAR 装 人 地 址 ， 然 后 向 内 存 发 出 READ 信 号 之 后 ， 
需要 等 待 5 个 周期 之 后 ， 内 存 数据 才能 装 入 MDR (注意 ， 微 指令 设置 READ 操 作 的 实际 方法 是 设置 
“MIO.EN/YES” 和 “R.W/RD9”， 参 见 图 C-3)。 

回忆 一 下 C.2 节 中 的 状态 33， 它 的 任务 是 取 指 令 (FETCH) 操作 ， 也 即 通过 内 存 访问 获取 指令 。 
换 句 话说， 状态 33 在 转移 至 “状态 35” 之 前 ， 要 连续 执行 5 次 。 因 为 每 个 时 钟 周期 都 要 有 规律 地 触 
发 一 次 状态 机 ， 所 以 在 MDR 获 取 来 自 MAR 指 定 内 存 地 址 中 的 有 效 数 据 之 前 ( 即 R 信 号 到 达 之 前 )， 
我 们 设计 了 让 “状态 33” 循 环 执行 的 机 制 。 状 态 35 要 做 的 事情 ， 是 将 MDR 的 内 容 再 次 搬移 到 了 蕉 寄 
存 器 中 。 由 于 内 存 访问 的 延迟 以 及 操作 的 异步 性 ， 我 们 将 取 指 令 操作 分 解 成 状态 33 和 状态 35 这 两 
全 状态 〈 而 不 是 一 个 ) 。 

R 信 号 (Ready) 的 作用 是 确保 内 存 访问 操作 的 有 序 执行 。 因 为 只 有 内 存 自 己 知道 需要 多 久 才 
能 完成 一 次 访问 〈 即 5 个 时 钟 周 期 ) ， 所 以 R 信 号 是 由 内 存 负责 生成 的 。 如 图 C-2 所 示 ， 如 果 当 前 时 
钟 周期 内 存 读 操作 没有 完成 ， 则 下 一 个 状态 仍然 是 状态 33 (地 址 100001) ;如果 完成 了 ， 则 转 入 
状态 35 (地 址 100011)。 如 图 C-5 所 示 ， 生 成 下 一 个 状态 地 址 的 具体 工作 ， 是 由 微 序 列 器 完成 的 。 

以 状态 33 为 例 ， 在 状态 33 中 ， 微 序列 器 10 个 控制 位 的 取 值 如 下 : 


IRD/0G ; NO 
COND/001  ; Memory Ready 
3/100001 


那么 在 此 情况 下 ， 微 序列 器 生成 的 下 一 个 状态 地 址 应 该 是 什么 呢 ? 在 状态 33 的 前 4 个 周期 执行 
中 ， 由 于 R 信 和 号 都 等 于 0， 所 以 生成 的 下 -个 状态 地 址 都 是 100001， 即 导致 状态 33 被 重复 执行 。 而 
在 第 5 个 周期 ， 如 果 R = 1， 则 下 一 个 状态 地 址 等 于 100011， 即 LC-3 转 移 至 状态 35。 注 意 ， 如 图 C-5 
所 示 ， 为 了 让 R 信 和 号 通过 ，COND0~2 必 须 设置 为 001 ( 即 R 是 4 个 输入 之 一 的 那个 与 门 )。 


C.5 AFRI IO 


如 第 8 章 所 述 ，LC-3 通 过 内 存 映射 /0 方式 控制 输入 /输出 ， 也 就 是 说 ， 采 用 与 读 写 内 存 一 样 的 
数据 报 移 指令 ， 来 读 写 输入 /输出 设备 。 为 此 ，LC-3 为 每 个 设备 寄存 器 都 分 配 了 一 个 地 址 。 有 关 设 
备 的 输入 /输出 操作 是 ， 在 输入 操作 中 ，load 指 令 的 有 效 地 址 是 输入 设备 的 寄存 器 地 址 ， 输 出 操作 
中 ，store 指 令 的 有 效 地 址 是 输出 寄存 器 地 址 。 例 如 ， 图 C-2 左 下 角 状 态 25 的 操作 ， 假 设 MAR 中 地 址 
内 容 等 于 xFE02， 即 MDR 内 容 来 自 KBDR， 则 load 读 入 的 数据 内 容 就 是 最 新 的 键盘 输入 字符 。 相 反 ， 
如 果 MAR 中 的 地 址 是 一 般 性 的 内 存 地 址 ， 则 MDR 内 容 就 由 内 存 负责 提供 。 

针对 内 存 映 射 7O 的 访问 ， 如 图 C-2 所 示 的 状态 机 并 不 需要 做 什么 特殊 修改 。 但 是 ， 我 们 仍然 


日 、MIO.EN/YES 和 R.W/RD 标 识 的 含义 是 “MIO.EN 信 号 = YES” 和 “R.W 信 和 号 = RD”。 由 于 之 后 的 很 多 地 方 
都 采用 这 种 标识 方法 ， 所 以 在 此 没有 做 更 直观 的 标识 改动 ， 而 是 维持 原 书 的 标识 方法 。 一 一 译 者 注 
O ”同样 ，IRD/0 的 意思 是 “IRD = 0”，J/100001 则 代表 “J = 100001”。 一 一 译 者 注 
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需要 设计 一 些 馆 辑 ， 以 判别 什么 时 候 内 存 访问 ， 什 么 时 候 访 问 /O 设 备 寄存 器 9S。 这 就 是 图 C-3 所 示 
的 地 址 控制 逻辑 所 做 的 工作 。 
表 C-3 地址 控制 逻辑 的 真 值 表 


MAR MIO.EN R.W MEM.EN IN.MUX LD.KBSR LD.DSR LD.DDR 
xFE00 0 R 0 x 0 0 0 
xFE00 0 w x 0 0 

xFE00 1 R 0 KBSR 0 0 0 
xFE00 1 W 0 x 1 0 0 
xFE02 0 R 0 x 0 0 0 
xFE02 0 Ww 0 x 0 0 0 
xFE02 1 R 0 KBDR 0 0 0 
xFE02 1 w 0 x 0 0 0 
xFE04 0 R 0 x 0 0 0 
xFE04 0 W 0 X 0 0 0 
xFE04 1 R 0 DSR 0 0 0 
xFE04 1 W 0 X 0 1 0 
xFE06 0 R 0 x 0 0 0 
xFE06 0 W 0 X 0 0 0 
xFE06 1 R 0 x 0 0 0 
xFE06 1 W 0 x 0 0 1 
other 0 R 0 X 0 0 0 
other 0 Ww 0 x 0 0 0 
other 1 R 1 mem 0 0 0 
other 1 w 1 x 0 0 0 





表 C-3 所 示 是 “地 址 控制 逻辑 ”的 真 值 表 ， 基 于 下 述 几 点 : (1) MAR, (2) 当前 周期 访问 对 
象 是 内 存 或 IO (MIO.ENVNO 或 YES) ; (3) 所 需 的 是 load 还 是 store 操 作 (R.W/Read& Write) 的 
输入 信号 。 注 意 ， 在 内 存 映射 方式 下 ，MDR 的 数据 来 源 可 以 是 以 下 4 个 之 一 : 内 存 、KBDR、 
KBSR 和 DSR， 即 地 址 控制 逻辑 通过 控制 INMUX 开 关 选 择 输 入 源 ， 同 样 ， 在 内 存 映射 方式 下 ， 
MDR 数 据 的 写 入 对 象 包括 : 内 存 、KBSR、DDR 和 DSR， 地 址 控制 逻辑 也 提供 了 对 应 每 个 模块 的 
使 能 信号 (如 MEM.EN、LD.XXX)。 


C.6 中 断 和 异常 控制 


有 关 LC-3 状 态 机 的 最 后 一 个 内 容 是 中 断 控制 ， 即 中 断 产生 、 中 断 返 回 (RTI 指 令 ) 和 异常 优先 
问题 ( 即 两 个 异常 同时 产生 的 情况 )。 这 里 所 说 的 异常 ， 是 指 “ 特 权 模 式 冲突 ”和 “非法 指令 ”这 
两 个 异常 。 图 C-7 所 示 是 相关 的 状态 机 描述 ， 图 C-8 则 是 在 补充 了 中 断 和 异常 处 理 模块 之 后 的 完整 


数据 通路 图 (参考 图 C-3)。 


但” 请 思 邯 :为 什么 要 判断 当前 访问 操作 的 对 象 是 内 存 还 是 VO 设备 ? 不 是 已 经 有 了 不 同 的 地 址 吗 ? 答案 是 ， 
“地 址 控制 逻辑 ”(ADDR_CTRL_LOGIC) 为 连接 在 总 线 (黑色 的 粗 线 ) 上 的 每 个 独立 的 被 访问 设备 或 内 
存 模块 〈 而 不 是 每 个 地 址 ) 都 准备 了 一 个 独立 的 “使 能 ”(EN) 控制 信和 号， 也 就 是 我 们 通常 所 说 的 片 选 
(CS) 或 片 使 能 (CE) 信和 号， 比如 图 中 的 MEM.EN 信 号 。 这 是 因为 地 址 的 解析 工作 是 每 个 内 存 模块 或 设备 
独立 完成 的 ， 但 只 有 对 应 EN 信号 有 效 的 情况 下 ， 该 内 存 模块 或 设备 才能 真正 “看 到 ”来 自 总 线 的 地 址 值 ， 
才能 继续 下 一 步 的 地 址 解析 工作 。 注 意 ， 原 理 是 相同 的 ， 但 在 此 ，LC-3 的 设计 将 总 线 和 模块 内 部 的 逻辑 放 
在 一 起 做 了 统一 描述 ， 显 得 更 加 细致 、 直 观 。 一 一 译 者 注 
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图 C-7 中 断 控制 流 的 LC-3 状 态 机 


C.6.1 中 断 启动 


程序 执行 过 程 中 ， 外 部 事件 (设备 发 出 的 ) 可 以 产生 中 断 请 求 ， 从 而 造成 正常 指令 执行 的 中 
止 ， 即 控制 器 临时 转 去 处 理 中 断 。 外 部 事件 通过 设置 中 断 请 求 信号 来 请 求 中 断 ， 回 顾 第 8 章 中 的 描 
述 ， 如 果 设 备 中 断 请 求 的 优先 级 高 于 正在 执行 程序 的 优先 级 ， 则 INT 信 号 有 效 且 将 相应 的 中 断 矢量 
装 和 信 INTV。 微 处 理 器 对 INT 信 号 的 响应 就 是 “启动 ”(initiating) 中 断 服 务 过 程 。 即 处 理 器 切换 至 
特权 模式 (supervisor mode)， 并 将 当前 被 中 断 进程 的 PSR 和 PC 保存 人 特权 堆栈 (俗称 “ 压 栈 ” 操 
作 )， 然 后 将 PC 内 容 禁 换 为 中 断 服务 程序 的 入 口 地 址 。 注 意 ， 被 保存 的 PSR 中 包含 了 当前 程序 (或 
进程 ) 的 权限 模式 PSR[15]、 优 先 级 PSR[10:8] 以 及 条 件 码 PSR[2:0]， 这 些 信息 很 重要 。 当 处 理 器 结 
东 中 断 处 理 后 ， 恢 复 被 中 断 程 序 时 ， 必 须 将 PSR 中 的 这 些 信息 恢复 到 正确 的 原 值 ， 所 以 需要 保存 这 


些 信息 。 
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图 C-8 LC-3 数 据 通路 完整 图 (包括 中 断 控制 ) 


在 LC-3 微 结构 中 ， 启 动 中 断 的 方式 正如 图 C-79 中 的 状态 18 所 示 的 闭 样 ， 在 将 PC 内 容 装 入 . 
MAR，PC 增 量 之 后 ， 检 测 INT 信 号 是 否 有 效 (如 果 INT 有 效 ， 则 启动 中 断 处 理 )。 

状态 18 是 处 理 器 检查 中 断 的 惟一 状态 。 只 在 状态 18 检 查 中 断 的 原因 很 简单 : LC-3 指 令 一 旦 开 
始 执 行 ,. 则 让 它 执 行 完 (即使 中 途 INT 信 号 已 经 有 效 )。 如 果 处 理 器 在 指令 执行 中 途 也 能 处 理 中 断 
( 即 在 各 个 状态 检查 INT)， 则 要 求 处 理 器 还 要 具备 保存 /恢复 指令 执行 的 中 间 状 态 (很 复杂 )。 因 而 ， 
只 在 状态 18 检 查 INT。 当 前 指令 周期 可 以 及 早 中 止 〈 甚 实 指令 还 未 被 FETCH) ， 并 借助 当前 周期 的 
时 间 ， 完 成 中 断 的 启动 工作 。 

另外 ， 也 仅 在 状态 18 下 ， 控 制 信号 (COND5) 的 取 值 为 101 (如 表 C-2 所 示 )， 即 充 许 INT 值 通 
过 4 输入 与 门 (AND) 参与 下 一 状态 的 地 址 计算 。 换 句 话 说， 由 于 COND 信 号 在 其 他 状态 下 的 取 值 


日 ”原文 中 是 图 C-2 (而 不 是 图 C-7)。 一 一 译 者 注 
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不 可 能 是 101， 所 以 INT 信 号 在 其 他 状态 下 不 起 作用 。 
在 状态 18 下 ， 微 序列 器 的 10 个 控制 位 取 值 如 下 : 


IRD/O ; NO 
COND/101  ; Test for interrupts 
J/100001 


如 果 此 时 INT = 1， 则 最 左边 的 AND 门 (如 图 C-5 所 示 ) 的 输出 为 1， 则 下 一 状态 的 地 址 为 
110001 ( 即 状态 49)， 而 不 是 100001 〈 即 状态 33) 。 状 态 机 的 中 断 启 动 过 程 由 此 开始 (参见 图 C-7)。 

状态 49 要 完成 的 工作 很 多 。 其 中 包括 : 将 PSR 装 和 人 MDR (PSR 中 包含 了 被 中 断 程序 的 特权 模 
式 、 优 先 级 和 条 件 码 等 信息 ) ， 以 备 将 其 压 人 特权 堆栈 :清除 PSRI15] 位 ， 即 表示 将 处 理 器 切换 到 
特权 模式 ， 因 为 中 断 服务 程序 必须 运行 在 特权 模式 下 ， 记录 由 中 断 设备 提供 的 3-bit 优 先 级 和 8-bit 
的 中 断 矢量 (INTV)， 将 优先 级 值 装 和 人 PSR[10:8]， 将 INTV 值 装 入 内 部 寄存 器 Vector， 最 后 ， 处 理 
器 在 压 人 PSR 和 PC 之 前 ， 要 测试 一 下 原先 的 PSR[15] 位 ， 以 判断 栈 指针 R6 指 向 的 是 哪 一 个 栈 (是 特 
权 栈 还 是 用 户 栈 )。 

如 果 原 先 的 PSR[15] = 0， 表 示 处 理 器 目前 已 处 于 特权 模式 了 ， 即 R6 代 表 SSP (特权 栈 指针 )， 
因而 处 理 器 很 快 转 入 状态 379 ， 并 将 被 中 断 程序 的 PSR 压 入 特权 栈 ， 如 果 PSR[15] = 1， 表 示 被 中 断 
进程 是 在 用 户 模式 下 ， 则 必须 先 将 USP 〈 即 R6 当 前 值 ) 保存 至 Saved_USP， 而 在 转 入 状态 37 之 前 ， 
必须 保证 R6 的 内 容 等 于 Saved SSP。 所 有 这 些 都 是 在 状态 45 内 完成 的 。 

从 状态 49 转 移 至 状态 37 或 状态 45 的 控制 流 ， 是 受 控 于 微 序 列 器 的 。 微 序列 器 的 当前 控制 位 取 


值 如 下 所 示 : 
IRD/0 ; NO 
COND/101 ; Test PSR[15], privilege mode 
J/100001 


T RPSR[15] = 0， 控 制 流 转 和 人 状态 37 (100101) ; 如果 PSR[15] = 1， 则 控制 流转 入 状态 45 
(101101), 

如 果 转 入 状态 37， 则 R6 (SSP) 递减 (为 压 酚 做 准备 ) ， 并 将 新 的 SSP 值 装 入 MAR 寄存 器 。 

随后 转 和 人 状态 41 ， 即 执行 压 栈 操作 。 先 是 设置 内 存 写 相关 信号 (MIO.EN/YES, R.W/WR), 
然后 等 待 写 操作 完成 〔 即 R 信 号 = 1)。 至 此 ，PSR 被 压 人 特权 栈 ， 随 后 控制 流转 人 状态 43。 

状态 43 中 ，PC 的 内 容 被 装 和 人 MDR。 注 意 ， 在 状态 43 中 ，MDR 装 入 的 是 PC-1 (而 不 是 PC) ,为 
什么 昵 ?因为 在 状态 18， 在 中 断 指令 执行 之 前 ，PC 已 被 递增 。 而 我 们 需要 记录 入 栈 的 是 中 断 指令 
所 在 的 地 址 ， 而 不 是 它 的 下 一 个 指令 。 

状态 47 和 48 所 做 的 事情 同 状态 37 和 状态 56@ 类 似 ， 只 不 过 此 时 压 人 管理 栈 的 内 容 是 被 中 断 进 
程 的 PC 值 。 

中 断 启动 的 最 后 一 个 任务 是 ， 将 中 断 服务 程序 的 入 口 地 址 装 入 PC， 即 状态 50、52 和 54 的 工作 。 
该 操作 和 TRAP 服 务 程序 加 载 PC 的 过 程 类 似 ， 发 出 INT 请 求 的 设备 提供 8-bit 中 断 矢 量 INTV ( 同 
TRAP 指 令 内 扔 的 8-bit 矢 量 类 似 )， 如 图 C-8 所 示 。 

中 断 矢量 表 位 于 内 存 地 址 x0100~x01FF 之 闻 。 在 状态 50 中 ， 将 Vector 中 的 矢量 值 (状态 49 装 入 
的 ) 与 中 断 矢量 表 基 址 (x0100) 相 加 ， 结 果 装 人 MAR， 随后 ， 在 状态 52 中 ， 等 待 内 存 数据 读 入 
( 即 中 断 矢量 表 中 存放 的 、 由 MAR 指 向 的 中 断 服务 程序 人 口 地 址 值 ) ， 当 R = 1 时 ， 读 操作 成 功 ， 
此 时 MDR 中 包含 的 即 是 中 断 服务 程序 的 入 口 地 址 ， 最 后 ， 在 状态 534 中， 将 该 地 址 装 入 PC。 至 此 ， 


O ”原文 是 “状态 37 和 状态 44”， 为 避免 误解 ， 译 文 将 “44” 删 除 。 状 态 44 是 中 断 服务 程序 返回 时 进 人 的 状态 ， 
原文 的 意图 是 走 “37 至 44” 的 这 样 一 个 状态 转移 线路 。 一 一 译 者 注 
旦 ”在 状态 机 图 C-2 和 图 C-7 中 都 没有 发 现 标注 为 56 的 状态 ， 但 原文 是 说 “状态 37 和 状态 56" 。 一 一 译 者 注 
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中 断 启动 工作 完成 。 
值得 一 提 的 是 ，LC-3 支 持 两 个 堆栈 ， 这 一 点 很 重要 。 在 特权 模式 和 用 户 模式 下 ， 各 有 一 个 堆 


栈 ， 且 各 有 一 个 堆栈 指针 USP 和 SSP， 两 个 指针 值 都 存放 在 R6 寄 存 器 中 。 当 权限 模式 从 用 户 模式 切 
换 到 特权 模式 时 ，R6 装 入 Saved_SSP 的 内 容 ， 而 从 特权 模式 转 入 用 户 模 式 时 ， 则 装 入 Saved_USP 的 
内 容 。 同 样 ， 当 权限 模式 改变 时 ，R6 的 当前 值 必 须 被 保存 在 合适 的 “Saved” 堆 栈 指针 中 ， 以 备 权 
限 模式 改变 回来 时 使 用 。 


C.6.2 中 断 返 回 


中 断 服务 程序 通过 中 断 返 回 (RTI) 指令 结束 中 断 执行 。RTI 指 令 的 任务 是 ， 将 计算 机 的 状态 
恢复 到 中 断 之 前 的 状态 ， 即 恢复 PSR (包含 权限 模式 、 优 先 级 和 条 件 码 N、Z、P 等 信息 ) 及 PC 的 
内 容 ， 这 些 都 是 事先 在 中 断 启动 时 压 入 堆栈 的 ， 它 们 从 堆栈 中 ， 以 与 压 和 人 (push) 过 程 相反 的 上 顺 
序 被 弹出 (pop)。 

RTI 指 令 被 解码 (DECODE， 状 态 32) 后 的 第 一 个 状态 是 状态 8。 在 此 ， 我 们 将 特权 栈 的 栈 顶 
地 址 装 入 MAR ， 其 中 包含 的 是 最 后 被 压 人 ， 且 之 后 一 直 没 有 被 弹出 过 的 内 容 ， 即 中 断 启动 时 的 PC 
值 。 另 外 ， 我 们 还 将 测试 PSR[15] 的 内 容 。 因 为 ，RTI 是 一 个 仅 在 特权 模式 下 才 可 以 被 执行 的 特权 
指令 。 如 果 PSR[15] = 0( 即 特权 模式 下 )， 则 继续 执行 RTI 剩 余 的 操作 ， 否 则 ， 就 认为 是 一 个 “ 权 
限 模式 异常 ” (priviledge mode exception) 事件 。 

PSR[15] = 0; RTIZE S dA fr 

状态 36 和 状态 38 负 责 PC 内 容 的 恢复 工作 。 在 状态 36 中 ， 读 内 存 操作 。 读 操作 完成 之 后 ，MDR 
包含 的 应 该 是 指向 被 中 断 指 令 的 地 址 值 。 状 态 38 则 负责 将 这 个 地 址 值 装 入 PC 寄存 器 。 

状态 39、40、42 和 34 则 负责 PSR 原 先 内容 的 恢复 ( 即 权限 模式 、 优 先 级 和 条 件 码 N、Z、P) 。 
其 中 ， 在 状态 39 中 ， 特 权 栈 指针 增 量 (SSP+1) ， 即 指向 PC 弹 栈 后 的 栈 顶 ， 并 将 新 的 栈 顶 地 址 装 和 人 
MAR， 状 态 40 等 待 内 存 读 操作 完成 ， 读 操作 完成 后 ，MDR 包 含 的 应 该 是 原先 的 PSR 值 ， 状 态 和 2 则 
将 MDR 内 容 装 入 PSR 寄 存 器 ， 最后， 状态 34 进 一 步 增 量 堆栈 指针 。 

状态 34 的 最 后 一 个 工作 是 ， 再 次 检查 原先 被 中 断 程序 的 权限 模式 ， 目 的 是 判断 堆栈 指针 是 否 
需要 做 转换 操作 。 在 状态 34 下 ， 微 序列 器 控制 位 的 取 值 如 下 : 

IRD/O ; NO 

COND/101  ; Test PSR[15], privilege mode 

J/110011 

如 果 PSR[15] = 0， 则 控制 流转 入 状态 51， 即 下 一 时 钟 周期 中 什么 也 不 做 ， 如 果 PSR[15] = 1, 
则 转移 蔚 状 态 $9， 即 将 当前 R6 内 容 存 人 Saved_SSP， 再 将 Saved_USP 内 容 装 人 R6。 之 后 ， 两 个 状 

态 (51 和 59) 都 回 到 状态 18 ， 即 继续 下 一 条 指令 的 处 理 。 

PSR[15]- 1; 权限 模式 异常 处 理 

如 果 PSR[15] = 1, 意味 着 处 理 器 现在 遇 到 了 非法 特权 模式 访问 ， 即 试图 在 用 户 模式 下 执行 RTI 
这 样 的 特权 指令 ， 这 是 “违法 ”的 。 

处 理 器 将 通过 调用 “权限 模式 异常 (或 非法 权限 访问 ，Privilege Mode Exception)” R3 EF 
来 处 理 这 类 事件 。 即 将 PSR 和 RTI 指 令 地 址 压 人 特权 堆栈 ， 然 后 将 处 理 “ 权 限 模式 异常 ”服务 程序 
的 入 口 地 址 装 入 PC 寄存 器 。 这 个 过 程 和 中 断 事 件 的 处 理 流程 非常 相似 。 

首先 ， 在 状态 44 中 执行 三 个 功能 ，(1) 将 指向 中 断 矢 量 表 中 “权限 模式 异常 ” 表 项 的 矢量 值 
装 入 Vector 寄存 器 ， 注 意 ， 这 只 是 一 个 8-bit 的 矢量 值 〈 即 x00) ; (2) 将 引起 该 非法 访问 的 程序 的 
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PSR 装 入 MDR，(3) 将 PSRf15] 设 置 为 0， 即 切换 至 特权 模式 (因为 中 断 服务 程序 必须 在 特权 模式 
下 执行 )。 随 后 ， 处 理 器 转 入 状态 45， 即 中 断 启 动 流程 中 的 中 间 状 态 点 。 

在 随后 的 处 理 流 程 中 ， 同 中 断 启动 流程 相 比 ， 人 惟一 的 不 同 点 体现 在 状态 50， 即 将 
x01<Vector> 装 入 MAR 的 操作 。 在 设备 中 断 处 理 的 例子 中 ，YVector 寄 存 器 中 存放 的 是 中 断 设备 提 
供 的 INTV 值 (在 状态 49 中 装 入 的 ) ， 而 在 “权限 模式 异常 ”例子 中 ，Vector 的 内 容 是 x00 (EIR 
态 44 中 装 人 的 )。 

还 有 两 个 细微 的 差别 ， 主 要 体现 在 状态 49 的 操作 中 。(1) 如 果 是 设备 中 断 处 理 ， 则 在 状态 49 
中 ， 要 修改 当前 执行 优先 级 (priority) ， 即 将 当前 优先 级 修改 为 请 求 中 断 设 备 的 优先 级 ( 即 提升 优 
先 级 )， 而 在 权限 模式 异常 处 理 中 ， 我 们 不 修改 优先 级 ， 即 让 异常 服务 程序 执行 在 与 引发 异常 的 程 
序 相 同 的 优先 级 别 下 。(2) 其 次 ， 中 断 处 理 时 ， 要 测试 一 下 当前 的 权限 模式 (以 决定 是 从 状态 49 
直接 转 和 人 状态 37， 还 是 转 人 状态 45) ， 而 在 权限 模式 异常 处 理 中 ， 则 不 做 测试 (因为 当前 权限 模式 
肯定 是 用 户 模式 )。 


C.6.3 非法 操作 码 异常 


在 C.6 节 开始 ， 我 们 就 提 到 ，LC-3 指 令 集 定义 了 两 种 异常 .权限 模式 异常 (Priviledge Mode 
Exception) 和 非法 操作 码 异常 (Illegal Opcode Exception)。 所 谓 权 限 模式 异常 ， 如 之 前 所 描述 的 ， 
即 处 理 器 试图 在 用 户 模 式 下 执行 RTI 指 令 。 而 如 果 被 执行 指令 的 操作 码 字 段 (IR[15:12]) 包含 了 一 
个 “未 定义 的 ”操作 码 (如 1101)， 则 将 引发 “非法 操作 码 ” 异 常 。 

处 理 器 处 理 “ 非 法 操作 码 ” 异 常 的 方法 同 处 理 “ 权 限 模 式 异 常 ” 的 方法 相似 。 即 将 程序 的 PSR 
和 PC 压 和 人 特权 堆栈 ， 然 后 将 “非法 操作 码 ” 的 异常 服务 程序 人 口 地 址 装 人 PC。 之 后 ， 服 务 程序 将 
按照 事先 规定 的 操作 来 处 理 非法 操作 码 (取决 于 操作 系统 的 设计 理念 )。 

如 果 处 理 器 进入 状态 13， 则 意味 着 一 定 是 遇 到 非法 操作 码 了 。 因 为 到 达 状 态 13 的 惟一 途径 是 
通过 状态 32 (IR 的 译 码 状 态 )。 状 态 13 的 操作 任务 ， 同 状态 49 (中 断 启 动 ) 以 及 状态 44 (权限 模式 
异常 的 启动 ) 的 操作 非常 相似 。 与 它们 相同 的 是 ， 状 态 13 将 完成 以 下 操作 : (1) 将 矢量 值 (x01) 
装 人 Vector 寄存 器 ， (2) 将 权限 模式 设置 为 特权 模式 (PSR[IS]E0) , (3) 将 PSR 装 入 MDR， 然 后 
压 人 特权 栈 。 

之 后 ， 状 态 13 将 与 状态 44 和 状态 49 各 不 相同 。 一 方面 如 状态 44， 它 不 改变 运行 程序 的 优先 级 ， 
因为 它 认为 处 理 异 常 的 紧迫 性 同 执行 紧迫 性 应 该 是 一 样 的 ， 另 一 方面 则 如 状态 49， 即 需要 测试 当 
前 的 权限 模式 ， 以 判断 当前 是 特权 模式 还 是 用 户 模式 。 因 为 在 用 户 模式 下 ， 堆 栈 指针 需要 进行 转 
换 (如 C.6.1 节 所 述 )。 同 样 (如 状态 49)， 状 态 13 之 处 将 出 现 局 部 分 支 (microbranches), ， 即 转 至 状 
3537 (如 果 栈 指针 已 指向 特权 栈 ) 或 转 至 状态 45 (如 果 栈 指针 必须 切换 )。 

再 之 后 的 过 程 ， 如 状态 37、41、43 等 等 ， 则 同 中 断 处 理 (如 C.6.1 节 所 述 ) 或 权限 模式 异常 处 
理 ( 如 C.6.2 节 所 述 ) 完全 一 样 ， 即 将 PSR 和 PC 压 人 特权 堆栈 ， 然 后 将 服务 程序 人 口 地 址 装 入 PC 中 ， 


最 终 启 动 异常 服务 程序 。 


C.7 控制 存储 器 


图 C-9 是 LC-3 微 编程 的 完整 实现 ， 即 控制 存储 的 全 部 内 容 。 每 个 地 址 代表 一 个 状态 ， 其 内 容 则 
对 应 当前 状态 下 49 个 控制 信号 的 取 值 。 但 事实 上 ， 这 些 表 项 的 内 容 都 是 空 着 的 ， 其 目的 是 为 了 让 
读者 享受 一 下 填充 的 乐趣 。 标 准 答案 请 咨询 你 的 老师 。 
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附录 D “C 编 程 语言 


D.1 概述 

本 附录 是 为 C 语 言 初学 者 提供 的 参考 手册 。 它 涵盖 了 C 语 言 的 各 个 重要 方面 ， 包 括 本 书 前 面 章 
节 没 有 涉及 的 部 分 。 本 附录 的 另 一 个 目的 是 作为 C 语 言 的 快速 参考 手册 ， 用 户 在 编程 遇 到 问题 时 ， 
可 以 在 本 附录 中 找到 C 语 言 的 各 种 特性 。 本 附录 后 面 的 每 个 条 目下 ， 都 会 包含 C 语 言 某 一 方面 的 特 
性 ， 并 在 需要 的 时 修 给 出 范例 。 
D.2 C 程 序 设 计 规范 

我 们 将 通过 分 析 和 描述 C 语 言 的 词法 元 素 ， 以 及 C 程 序 员 常用 的 一 些 编程 规范 ， 来 介绍 C 程 序 
设计 语言 。 
D.2.1 HX 

C 程 序 设 计 规 范 建议 ， 将 程序 分 为 两 种 类 型 的 文件 : 源 文件 (由 .c 后 缀 标识 ) 和 头 文件 (H.h 
标识 )。 源 文件 中 包含 了 一 组 相关 函数 的 定义 ， 比 如 ， 管 理 堆栈 数据 结构 的 函数 ， 可 能 会 在 文件 名 
为 stack.c .的 文件 中 定义 。 每 个 .文件 都 将 被 编译 成 一 个 目标 文件 ， 这 些 目标 文件 再 由 链接 程序 链 
接 成 一 个 可 执行 文件 。 
D.2.2 ” 头 文件 

头 文件 中 包含 函数 、 变 量 、 结 构 体 和 类 型 的 声明 ， 以 及 一 些 预 处 理 宏 ， 但 一 般 不 包含 任何 C 语 
句 。 头 文件 都 是 对 应 于 源 文 件 的 ， 在 头 文件 中 声明 的 函数 ， 将 在 源 文件 中 定义 。 例 如 ， 如 果 源 文 
ftstdio.crpaE X f if Zirprintf, scanf, getcharffüputchar, $A AX fstdio.h rop Bl & ix He pr EJ p 
明 。 如 果 其 他 源 程序 需要 调用 stdio.c 中 定义 的 这 些 国 数 ， 那 么 只 需要 在 这 些 源 程序 里 包含 头 文件 
stdio.h 就 可 以 了 。 . 


D.2.3 注释 

C 语 言 里 的 和 福 释 起 始 于 “/#”， 终 止 于 “*/”， 它 可 以 占据 多 行 。 但 是 注释 不 支持 修 套 ， 大 多 数 
的 编译 器 对 于 艇 套 的 注释 都 会 产生 一 个 语法 错误 。 注 释 也 不 能 位 于 一 个 字符 串 内 部 ， 否 则 注释 将 
被 认为 是 字符 串 的 一 部 分 而 失效 。 虽 然 ANSI C 标 准 中 只 允许 使 用 “/*” 和 “*/”， 但 是 现在 很 多 的 
编译 器 都 支持 C++ 的 注释 方式 (//)。 
D.2.4 文字 常量 

C 语 言 中 的 文字 常量 (literal) 可 以 分 为 整数 常量 (integer literal) 、 浮 点 数 常量 (float literal), 
字符 常量 (character literal)、 字 符 串 常量 (string literal), 、 枚 举 常量 (enumerator literal) 等 。 文 字 
常量 可 以 用 来 初始 化 变量 ， 也 可 以 出 现在 表达 式 中 ， 下 面 将 分 别 给 出 例子 。 


1. 整数 常量 
整数 类 型 的 文字 常量 一 般 用 十 进 制 、 八 进 制 或 十 六 进 制 形 式 表 示 。 以 0 作为 前 组 的 整 型 常量 是 
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八进制 形式 ， 以 0x 作 为 前 组 的 整 型 常量 是 十 六 进 制 形 式 〈 因 此 ， 它 可 以 由 数字 0~9， 字 母 a~{f 或 者 
A~F 组 成 )， 不 带 前 级 0 和 0x 的 整 型 常量 是 十 进 制 形式 。 在 整数 常量 前 面 加 上 “一 ”号 ， 就 表示 相应 


的 负 整 数 。 

在 整数 常量 后 面 加 上 后 弘 “L” 或 “1” 表 示 长 整 型 数 ， 加 上 后 绎 “UV” 或 “u” 表 示 无 符号 整 
数 。 请 参考 D.3.2 节 对 长 整 型 数 和 无 符号 整数 的 介绍 。 

下 面 例子 中 ， 前 面 三 个 表示 相同 的 数字 87 ， 最 后 两 个 分 别 表 示 无 符号 类 型 和 长 整 型 的 数字 87 : 


87 /* 87 in decimal *f 
0x57 /* 87 in hexadecimal */ 
0127  /* 87 in octal */ 
-24 /* -24 in decimal */ 
-024  /* -20 in octal */ 


-0x24 /* -36 in hexadecimal */ 


2. i$ 5d E 

浮 点 数 常 量 由 三 个 部 分 组 成 ;整数 部 分 、 小 数 点 和 小 数 部 分 。 其 中 小 数 部 分 和 整数 部 分 是 可 
选 的 ， 但 是 这 两 部 分 必须 至 少 存在 一 个 。 和 整 型 数 一 样 ， 在 前 面 加 上 “-” 号 就 表示 相应 
的 负数 。 下 面 给 出 泽 点 数 表示 的 几 个 例子 : 


1.613123 
$n 
/* expresses the number 1.0 */ 


.613123 


浮 点 数 常量 还 可 以 用 指数 形式 表示 ， 指 数 形式 的 浮 点 数 由 一 个 浮 点 常量 、 字 符 e( 或 E) 和 一 个 整 
数组 成 。e( 或 E) 后 面 的 整数 表示 浮 点 数 的 指数 部 分 ， 它 可 以 是 负数 ， 也 可 以 没有 。 如 果 指 数 部 分 存 
在 ， 则 小 数 点 可 以 省 略 。 指 数 形式 的 浮 点 数 表 示 的 值 ， 为 前 面 的 浮 点 常量 乘 以 10 的 指数 次 署 ， 例 如 : 

6.023e23 /* 6.023 * 10^23 


454.323e-22 /* 454.323 * 10^(-22) x) 
SE13 /* 5.0 * 10^13 */ 


默认 情况 下 ， 浮 点 数 都 是 双 精 度 类 型 。 如 果 要 定义 单 精度 类 型 的 浮 点 数 ， 可 以 在 浮 点 常量 后 
面 加 上 后 缀 六 或 F。 要 定义 长 双 精 度 浮 点 数 〈 见 D.3.2 节 )， 则 要 在 浮 点 常量 后 面 加 上 “7 或 “L” dE 
Anf. 

3. 字符 常量 

字符 常量 由 单 引 号 括 起 来 的 单个 字符 表示 ， 例 如 “c'， 这 样 就 将 该 字符 转换 为 计算 机 内 部 使 
用 的 ASCII 码 值 。 现 在 包括 LC-3 在 内 的 大 多 数 计算 机 ， 在 内 部 都 是 使 用 ASCII 码 来 表示 字符 。 

表 D-1 列 出 了 一 些 特殊 的 字符 ， 这 些 字符 不 能 用 键盘 的 某 个 键 表示 出 来 ， 因 此 C 语 言 通过 一 申 
特殊 的 字符 序列 来 表示 这 些 字 符 。 表 中 最 后 两 行 给 出 了 表示 字符 常量 的 另 一 种 方法 ， 通 过 转 义 字 
符 、\ 将 字符 的 ASCI 码 值 转换 为 相应 的 字符 ， 其 中 ASCII 值 既 可 以 是 八进制 形式 ， 也 可 以 是 十 六 
进 制 形式 。 例 如 ， 字 符 “S ”的 ASCII 码 值 为 83， 因 此 “S” 既 可 以 用 “0123” 也 可 以 用 “\x53， 
来 表示 。 


表 D-1 C 语 言 中 的 特殊 字符 

















换行 \n ERST 

横向 制 表 符 x 问号 v 

纵向 制 表 符 Ww 单 引 号 M 

退 格 \b 双 引 号 l V 

回 车 N 八进制 数 NOnnn 

¥ 十 六 进 制 数 \xnnn 
a 
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4. 字符 串 常 量 
C 语 言 中 ， 用 双 引 号 括 起 来 的 字符 序列 表示 字符 串 常 量 。 字 符 串 常量 是 char * 类 型 ， 它 存放 在 


专门 为 常量 保留 的 一 段 特 殊 内 存 区 段 里 。 字 符 串 常 量 后 面 将 自动 加 上 “\O” 来 指示 字符 串 结束 。 下 
面 是 字符 串 常量 的 两 个 例子 : 


char greeting[10] = "bon jour!"; 
printf("This is a string literal"); 


字符 串 常 量 可 以 用 来 初始 化 字符 串 ， 也 可 以 用 在 任何 可 以 使 用 char * 类 型 的 地 方 。 例 如 ， 某 个 
函数 需要 char * 类 型 的 参数 ， 那 么 字符 串 常 量 就 可 以 直接 传递 给 这 个 函数 。 但 要 注意 的 是 ， 字 符 串 
常量 不 能 直接 传递 给 字符 数组 。 例 如 ， 下 面 这 段 代码 在 C 语 言 里 是 不 合法 的 : 

char greeting [10]; 


greeting = "bon jour!"; 


5. 枚 举 常 量 
和 枚 举 类 型 ( 见 D.3.1 节 ) 相关 的 常量 称 为 枚 举 器 ， 也 称 为 枚 举 常量 。 枚 举 常量 都 是 整数 类 型 ， 


它们 的 值 是 在 枚 举 类 型 定义 的 时 候 确定 的 。 简 言 之 ， 枚 举 常 量 就 是 一 个 表示 某 个 特定 整数 值 的 符 
号 而 已 。 
D.2.5 程序 格式 

C 语 言 的 格式 比较 随意 ， 程 序 员 可 以 任意 地 在 语句 间 加 入 空格 、 制 表 符 、 回 车 符 和 换行 符 。 但 
是 为 了 使 程序 更 加 清晰 可 读 ， 程 序 员 常常 会 在 语句 间 使 用 缩 进 ， 在 不 相关 代码 间 加 入 空 行 ， 对 齐 
括号 等 ， 并 且 经 常 在 难于 理解 的 代码 段 旁 边 加 上 注释 。 注 释 对 于 那些 对 程序 不 熟悉 的 人 来 说 非常 
重要 。 读 者 可 以 参考 本 书 在 C 编 程 章节 中 给 出 的 那些 例 程 的 格式 。 


D.2.6 关键 字 


下 面 列 出 了 C 语 言 中 保留 使 用 的 符号 一 一 关键 字 。 关 键 字 在 C 语 言 里 都 有 特殊 的 意义 ， 例 如 用 
于 类 型 定义 、 结 构 控 制 等 ， 因 此 程序 员 不 能 使 用 关键 字 作 为 程序 中 的 变量 名 或 函数 名 。 


auto double int struct 
break else long Switch 
case enum register typedef 
char extern return union 
const float short unsigned 
continue for signed void 
Gefault goto sizeof volatile 
do if static while 
D.3 类 型 


C 语 言 里 ， 表 达 式 、 函 数 ， 变 量 等 都 有 相应 的 类 型 。 以 变量 的 类 型 为 例 ， 它 指定 了 该 变量 能 够 
表示 什么 样 的 值 。 假 设 kappa 是 一 个 int 类 型 的 变量 ， 那 么 kappa 代 表 的 值 将 被 编译 器 解释 为 一 个 有 
符号 整数 。C 语 言 中 的 类 型 分 为 两 类 ， 一 类 是 基本 数据 类 型 ， 即 C 语 言 本 身 提供 的 ， 另 一 类 是 用 户 
扩展 的 类 型 ， 这 种 类 型 需要 由 程序 员 自 己 在 程序 里 面 定义 。 


D.3.1 基本 数据 类 型 


C 语 言 本 身 定 义 了 几 种 基本 数据 类 型 : int、float、double 和 char， 所 有 C 语 言 的 实现 都 要 能 够 
支持 这 些 基本 数据 类 型 。 但 是 它们 占据 内 存 空间 的 大 小 和 数值 范围 是 与 平台 相关 的 。 

1. int 

int 类 型 在 C 语 言 里 指 有 符号 整 型 数 ， 大 多 数 的 计算 机 都 使 用 32 位 的 二 进 制 数 来 表示 int 类 型 变 
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量 。 这 样 ， 一 个 整 型 数 的 取 值 范围 就 是 -2 147 483 648 ~ +2 147 483 647, 

2. float 

float 类 型 指 单 精度 浮 点 数 ， 大 多 数 (不 是 所 有 的 ) 计算 机 都 是 依照 IEEE 单 精度 浮 点 数 标准 来 
表示 的 ， 即 用 32 位 来 表示 一 个 单 精度 浮 点 数 。 这 32 位 分 为 符号 部 分 (1 位 )、 指 数 部 分 (8 位 ) 和 小 
数 部 分 (23 位 )。 想 了 解 更 多 关于 IEEE 浮 点 数 标 准 的 读者 ， 可 以 参考 2.7.1 季 。 

3. double 

double 类 型 指 双 精度 浮 点 数 ， 它 和 float 类 似 ， 也 使 用 IEEE 的 标准 定义 。 虽 然 float 和 double 定 义 
的 精度 是 与 系统 相关 的 ， 但 是 ANSI C 标 准 规定 ，double 的 精度 不 能 低 于 float。 现 在 大 多 数 的 计算 
机 都 定义 double 为 64 位 。 

4. char 

char 类 型 的 变量 表示 一 个 字符 , 在 计算 机 内 部 , 都 是 使 用 某 种 字符 编码 来 表示 字符 。 为 了 统一 ， 
现在 大 多 数 计算 机 都 使 用 ASCII 码 ( 见 附录 E) 来 表示 字符 。char 类 型 必须 能 够 包含 整个 字符 集 ， 
另外 ，Ci 语 言 规定 ，short int 类 型 长 度 不 小 于 char 类 型 。 | 

总 的 来 说 ，int 和 char (包含 枚 举 类 型 ) 都 是 整数 类 型 ， 而 float 和 double 都 是 浮 点 数 类 型 。 

5. 枚 举 类 型 

通过 枚 举 类 型 ， 程 序 员 可 以 在 C 语 言 里 定义 符号 值 类 型 的 变量 。 比 如 我 们 想 定 义 一 种 类 型 ， 该 
类 型 可 以 取 以 下 四 个 符号 值 ，Penguin、Riddler、CatWoman、Joker， 我 们 可 以 通过 枚 举 类 型 来 实现 : 


/* Specifier */ 
enum villains { Penguin, Riddler, CatWoman, Joker }; 


/* Declaration */ 
enum villains badGuy; 


这 样 ，badGuy 就 是 枚 举 类 型 villains 的 一 个 变量 ， 它 的 取 值 范 围 就 是 在 villains 类 型 定义 时 列 出 
来 的 四 个 值 ，Penguin、Riddler、CatWoman 和 Joker。 枚 举 类 型 中 定义 的 符号 常量 称 为 枚 举 常 量 
( 见 D.2.4 节 )， 枚 举 常量 其 实 就 是 整数 值 。 

在 枚 举 列表 中 ， 第 一 个 枚 举 常量 被 自动 赋值 为 0， 接 下 来 顺序 赋值 为 1 、2…… 在 前 面 声明 的 
villains 中 ，Penguin 的 值 为 0，Riddler 为 1，CatWoman 为 2，Joker 为 3。 程 序 员 也 可 以 显 式 地 给 枚 举 
常量 赋值 ， 例 如 : 


/* Specifier */ 
enum villains { Penguin = 3, Riddler, CatWoman, Joker }; 


这 样 ，Penguin 的 值 就 为 3，Ridder 为 4，CatWoman 为 5，Joker 为 6。 


D.3.2 类 型 限定 词 

类 型 限定 词 可 以 用 来 修饰 基本 类 型 ， 并 改变 所 修饰 基本 类 型 的 某 些 特性 ， 比 如 变量 默认 的 数 
值 范围 。 

1. signedfeunsigned 

int 和 char 类 型 可 以 被 signed 和 unsigned 限 定 词 修饰 ， 默 认 情况 下 ，int 类 型 是 有 符号 类 型 ， 但 是 
char 类 型 在 默认 情况 下 ， 却 是 和 计算 机 平台 相关 的 。 

如 果 计 算 机 用 32 位 二 进 制 数 来 表示 有 符号 整数 ， 那 么 有 符号 整数 的 取 值 范围 是 -2 147 483 648 ~ 92 
147 483 647。 在 相同 的 机 器 上 ， 无 符号 整数 的 取 值 范围 就 是 0 一 +4 294 967 295, 


signed int c; /* the signed modifier is redundant */ 
unsigned int d; 


signed char j; /* forces the char to be interpreted 
as a signed value */ 


unsigned char k; /* the char will be interpreted as an 
unsigned value */ 
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2. long 和 short 

程序 员 可 以 使 用 long 和 short 限 定 词 来 指定 基本 类 型 的 物理 长 度 ， 例 如 它们 和 整数 类 型 搭配 ， 
可 以 定义 短 整 型 (short int) 和 长 整 型 (long int) 变量 。 

要 注意 的 是 ，C 语 言 并 没有 严格 定义 每 种 整 型 之 闻 物 理 长 度 的 差异 ， 它 仅仅 规定 了 短 整 型 长 度 
小 于 或 等 于 整 型 ， 整 型 长 度 小 于 或 等 于 长 整 型 。 即 : 

sizeof(char)«-sizeof(short int)«-sizeof(int)«-sizeof(long int) 

在 支持 64 位 数据 类 型 的 计算 机 系统 里 ，long int 可 能 是 64 位 整数 ， 而 int 是 32 位 整数 。 特 定 杀 统 
的 基本 类 型 长 度 ， 可 以 在 <limits.h> 头 文件 中 找到 ， 类 Unix 的 系统 中 ， 读 文件 存放 在 /usr/inclcude 目 
录 下 。 

下 面 列 出 了 儿 个 使 用 限定 词 来 修饰 整数 类 型 的 例子 : 

short int q; 


long int p; 
unsigned long int r; 


long 和 short 也 可 以 用 来 限定 双 精 度 浮 点 数 类 型 double，long double 可 以 用 来 创建 比 double 精 度 
更 高 的 浮 点 数 。ANSI C 规 定 ，float 长 度 小 于 或 等 于 double，double 长 度 小 于 或 等 于 long double, 


double x; 
long double y; 


3. 限定 词 const 

在 C 程 序 执行 过 程 中 ， 不 能 被 修改 的 变量 可 以 使 用 const 限 定 词 来 定义 ， 例 如 : 

const double pi = 3.14159; 

在 程序 里 不 会 改变 的 变量 ， 程 序 员 应 该 尽量 使 用 const 限 定 词 ， 这 样 编译 器 可 以 对 代码 进行 最 
大 限度 的 优化 。 由 于 在 程序 执行 过 程 中 不 能 被 修改 ， 因 此 const 限 定 的 变量 必须 在 定义 的 时 候 进行 
初始 化 。 


D.3.3 存储 类 型 


C 语 言 中 有 两 种 存储 类 型 : 静态 (static) 和 自动 (automatic)。 自 动 类 型 变量 位 于 一 个 代码 块 
(比如 函数 ) 中 ， 一 旦 这 个 代码 块 执行 完成 ， 自 动 类 型 变量 的 值 就 丢失 了 。 上 默认 情况 下 ， 函 数 内 部 
的 自动 类 型 变量 的 存储 空间 ， 都 是 在 程序 的 执行 栈 中 分 配 的 ( 见 14.3.1 匠 )。 

静态 类 型 变量 的 值 在 整个 程序 的 执行 过 程 中 都 有 效 。 在 代码 块 的 外 部 声明 的 全 局 变量 是 静态 
类 型 的 ， 如 果 想 在 代码 块 的 内 部 声明 静态 类 型 变量 ， 可 以 在 变量 的 前 面 加 上 static 限 定 词 。 用 static 
限定 的 变量 ， 在 声明 它 的 函数 执行 完毕 后 仍然 存在 。 例 如 ， 

int Count (int x) 

Static int y; 


yvtt: 
printf ("This function has been called %d times.", y); 


静态 类 型 变量 y 的 值 在 函数 Count 执 行 完 后 仍然 存在 。 实 际 上 ， 静 态 类 型 变量 都 是 在 全 局 数据 
区 中 分 配 空间 ， 因 此 变量 的 值 在 程序 的 执行 过 程 中 不 会 丢失 ， 程 序 每 次 调用 Count 时 ， 都 会 去 更 新 


y 的 值 。 
和 自动 类 型 变量 不 同 ， 静 态 类 型 变量 在 定义 时 ， 都 会 自动 被 初始 化 为 0。 自 动 类 型 变量 则 要 靠 
程序 员 来 初始 化 。 


C 语 言 还 提供 了 一 个 限定 词 register。register 能 够 限定 任何 自动 类 型 变量 ,表明 该 变量 会 经 党 
访问 ， 应 该 为 它 在 寄存 器 中 分 配 空间 ， 以 提高 性 能 。 但 是 编译 器 仅仅 把 register 限 定 当 做 建议 而 已 ， 
是 否 分 配 寄存 器 空间 ， 取 决 于 编译 器 自己 的 分 析 ， 以 及 当前 是 否 还 有 寄存 器 空间 。 
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函数 和 变量 都 可 以 用 extem 限 定 词 来 修饰 , 表明 该 函数 或 变量 的 存储 空间 定义 在 另 一 个 模块 中 ， 
编译 器 会 在 生成 可 执行 代码 的 过 程 中 ， 将 这 些 变量 或 函数 链接 在 一 起 。 


D.3.4 扩展 类 型 


扩展 类 型 是 c 语 言 基本 类 型 的 衔 生 。 扩 展 类 型 包含 指针 、 数 组 、 结 构 体 和 联合 体 。 结 构 体 和 联 
合体 允许 程序 员 创 建 自己 定义 的 新 类 型 ， 这 些 新 类 型 由 其 他 基本 类 型 组 成 。 

1. 数组 

数组 是 由 相同 类 型 的 数据 组 成 的 一 个 序列 ， 它 们 在 内 存 中 顺序 存放 。 即 如 果 类 型 T 数 组 的 第 一 
个 元 素 位 于 内 存 地 址 X， 那 么 该 数组 的 下 一 个 元 素 就 位 于 内 存 地 址 X+sizeof(T)， 依 此 类 推 。 数 组 的 
元 素 都 可 以 通过 一 个 索引 值 来 访问 ， 索 引 值 从 0 开始 依次 增加 。 数 组 list 的 第 一 个 元 素 是 list[0]。 在 
声明 数组 的 时 候 ， 数 组 的 大 小 必须 是 一 个 整 型 常量 表达 式 。 


char string[100]; /* Declares array of 100 characters */ 


int data[20]; /* Declares array of 20 integers */ 
数组 通过 整 型 表达 式 作为 下 标 ， 来 访问 数组 中 的 某 个 元 素 : 
data [0] /* Accesses first element of array data */ 
data[i « 3] /* The variable i must be an integer */ 
string[x + y] /* x and y must be integers */ 


编译 器 并 不 检查 对 数组 的 访问 是 否 越界 ， 因 此 程序 员 必 须 确 保 对 数组 的 访问 是 合法 的 。 例 如 ， 
使 用 前 面 定义 的 string 数 组 时 ， 引 用 string[x+y] 的 下 标 x+y 必 须 小 于 100， 否 则 就 会 发 生 内 存 访问 越 
界 的 错误 。 

2. 指针 

指针 是 用 来 存储 变量 地 址 的 数据 类 型 ， 在 标识 符 前 面 加 上 星 号 * 就 声明 了 指针 变量 ， 指 针 的 类 
型 表示 指针 可 以 指向 的 对 象 类 型 ， 例 如 

int *v; /* v points to an integer */ 

C 只 允许 对 指针 变量 进行 一 组 受 限制 的 操作 。 例 如 指针 可 以 出 现在 算术 表达 式 中 ， 可 以 用 一 个 
指针 对 同类 型 的 另 一 个 指针 赋值 ， 也 可 以 为 一 个 指针 赋值 0( 赋 值 为 0 的 指针 称 为 空 指针 )。 指 针 变 量 
还 可 以 加 上 或 减 去 一 个 整数 值 ， 指 针 变 量 之 间 也 可 以 进行 比较 或 加 减 运算 ， 这 种 情况 在 用 指针 操作 
数组 时 会 经 常 磁 到 。 除 了 这 些 之 外 ，C 不 允许 对 指针 变量 进行 其 余 的 操作 ， 除 非 进 行 强制 类 型 转换 。 

3. 结构 体 

程序 员 可 以 使 用 结构 体 来 实现 类 型 的 集合 。 结 构 体 由 一 组 元 素 组 成 ， 每 个 元 素 都 有 自己 的 类 
型 。 下 面 的 代码 声明 了 一 个 结构 体 ， 


struct tag id ( 
typel memberl; 
type2 member2; 


typeN memberN; 


这 个 结构 体 由 N 个 元 素 组 成 ，member1 是 typel 类 型 变量 ，member2 是 type2 类 型 变量 ，memberN 
是 typeN 类 型 变量 。 组 成 结构 体 的 元 素 可 以 是 任何 类 型 ， 包 括 其 他 程序 员 定 义 的 扩展 类 型 。 

程序 员 在 定义 时 可 以 为 结构 体 指 定 一 个 标签 ， 例 如 上 面 例子 中 的 tag_id， 这 样 就 可 以 使 用 它 来 
声明 结构 体 变量 : 

struct tag id x; 

结构 体 由 它 的 标签 确定 。 例 如 一 个 程序 里 声明 了 许多 结构 体 ， 这 些 结构 体 有 相同 的 成 员 元 素 ， 
而 且 元 素 的 类 型 完全 相同 。 但 是 ， 只 要 给 它们 定义 的 标签 不 同 ， 这 些 结 构 体 就 不 同 。 
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结构 体 变 量 可 以 在 结构 体 定义 的 同时 进行 声明 ， 如 下 例 所 示 ， 变 量 firstPoint 在 结构 体 point 定 
义 的 时 候 进 行 声明 ， 数 组 image 则 是 在 结构 体 定义 完 后 ， 通 过 结构 体 标签 point 来 声明 。 
struct point { 
int y; 


] firstPoint; 


/* declares an array of structure type variables */ 
struct point image[100]; 


有 兴趣 的 读者 ， 可 以 参考 19.2 节 关于 结构 体 的 介绍 。 
4. 联合 体 
结构 体 由 许多 各 种 类 型 的 变量 组 成 。 联 合体 和 结构 体 不 同 ， 在 不 同时 刻 ， 联 合体 只 包含 多 个 
不 同类 型 变量 中 的 一 个 变量 。 例 如 ， 下 面 的 代码 声明 了 一 个 联合 体 变量 joined: 
iat I iral; 
double fval; . 


char | ceval; 
) joined; 


变量 joined 是 一 组 比特 数据 ， 这 些 比特 可 以 是 一 个 整数 、 浮 点 数 或 者 字符 数据 。 例 如 使 用 表达 
式 joined.ival， 联 合体 就 是 一 个 整数 ， 如 果 使 用 joined.fval， 联 合体 就 是 浮 点 数 ， 如 果 使 用 
joined.cval， 联 合体 就 成 了 一 个 字符 变量 。 编 译 器 将 按照 联合 体 中 占用 空间 最 大 的 类 型 ， 来 为 联合 
体 分 配 空间 。 例 如 在 上 面 的 例子 中 ， 编 译 器 将 按照 double 类 型 的 大 小 ， 为 联合 体 分 配 存储 空间 。 


D.3.5 typedef 


C 语 言 允许 程序 员 用 typedef 为 一 个 已 存在 的 类 型 创建 一 个 新 的 类 型 名 ， 这 在 程序 员 定 义 自己 的 
扩展 类 型 时 非常 有 用 。 使 用 typedef 的 一 般 形式 如 下 ; 


typedef type name; 


其 中 ，type 可 以 是 任何 基本 类 型 、 枚 举 类 型 或 其 他 扩展 类 型 ，name 是 任意 合法 的 标识 符 。 这 
样 就 为 类 型 type 取 了 一 个 别名 name， 任 何 使 用 type 的 地 方 ， 都 可 以 使 用 name 来 代替 。 一 个 好 的 类 
型 名 能 包含 该 类 型 的 一 些 额外 信息 ， 这 样 可 以 增强 程序 的 可 读 性 。 下 面 是 儿 个 例子 ， 

typedef enum (coffee, tea, water, Soda] Beverage; 

Beverage drink; /* Declaration uses previous typedef */ 

typedef struct { 

int xCoord; 
int yCoord; 
int color; 

) Pixel; 


Pixel bitmap[1024*820]; /*Declares an array of pixels*/ 


D.4 声明 

C 语 言 里 的 一 个 对 象 【比如 变量 ) 就 是 一 段 有 名 字 的 内 存 段 ，C 语 言 规 定 ， 对 象 在 使 用 前 必须 
先 声明 。 对 象 的 声明 告诉 编译 器 该 对 象 的 类 型 、 名 字 、 存 储 类 别 等 ， 这 样 编译 器 才能 为 该 对 象 分 
配 空间 ， 以 及 为 该 对 象 的 访问 产生 正确 的 机 器 代码 。 

函数 在 使 用 前 也 必须 先 声 明 。 函 数 的 声明 告诉 编译 器 它 返回 值 的 类 型 、 函 数 名 、 参 数 类 型 和 
参数 的 顺序 。 i l 


D.4.1 变量 声明 
变量 声明 格式 如 下 ; 
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[存储 类 别 ] [类 型 限定 ] {类 型 } {标识 符 } [= 初始 化 值 ]， 

{} 中 的 字段 是 必需 的 ，[] 中 的 字段 可 选 。 

存储 类 别 可 以 是 D.3.3 中 列 出 的 任意 存储 类 别 限 定 词 ， 比 如 static。 

类 型 限定 可 以 是 D.3.2 中 列 出 的 任意 类 型 限定 词 。 

类 型 可 以 是 任何 基本 类 型 (iait、char、float 和 double)、 枚 举 类 型 或 衍生 类 型 (数组 、 指 针 、 
结构 体 、 联 合体 ) 。 

标识 符 是 以 字母 或 下 划 线 开头 的 字母 、 数 字 、 下 划 线 的 任意 组 合 。C 语 言 对 标识 符 的 长 度 没有 
限制 ， 但 是 ANSI C 编 译 器 只 使 用 最 前 面 31 个 字符 来 区 分 变量 的 标识 符 ， 前 面 31 个 字符 相同 的 变量 ， 
将 被 当做 同一 个 变量 。 另 外 ，C 语 言 是 区 分 大 小 写 的 ， 因 此 标识 符 sum 和 Sum 是 不 同 的 。 最 后 ， 标 
识 符 不 能 和 关键 字 相 同 ( 见 D.2.6 节 )。 下 面 是 合法 标识 符 的 例子 : 

alusi 

Blue2 

_blue_ 

bluE 


primary colors 
primaryColors 


只 要 是 能 在 自动 存储 类 型 ( 见 D.3.3 节 ) 变量 赋值 语句 之 前 确定 值 的 表达 式 ， 都 可 以 作为 自动 
存储 类 型 变量 的 初始 化 值 ， 但 是 只 能 使 用 常量 表达 式 来 初始 化 静态 存储 类 型 变量 或 外 部 变量 。 

C 语 言 允 许 在 同一 行 指定 多 个 标识 符 〔( 和 初始 化 值 ) 来 创建 多 个 同 种 类 型 的 变量 ， 这 些 变量 有 
相同 的 存储 类 别 和 类 型 特征 。 


static long unsigned int k = 10UL; 

register char 1 - 'Q'; 

int list[100]; 

struct node type n; /* Declares a structure variable */ 


变量 可 以 在 任何 代码 块 的 起 始 处 声明 ( 见 D.6.2 节 )， 也 可 以 在 所 有 联 数 的 外 部 声明 ， 在 代码 块 
的 起 始 处 声明 的 变量 ， 仅 仅 在 该 代码 块 中 可 见 ， 而 在 所 有 函数 外 部 声明 的 变量 ， 在 程序 的 各 个 部 
分 均 可 见 ， 因 此 这 样 的 变量 也 称 为 全 局 变量 。 参 考 12.2.3 节 关于 变量 声明 的 详细 介绍 。 

D.4.2 函数 声明 

函数 声明 告诉 编译 器 ， 该 函数 返回 值 的 类 型 和 调用 该 函数 需要 传递 的 参数 类 型 、 参 数 个 数 和 
参数 的 顺序 。 函 数 声 明 格 式 如 下 ; 

(ZW ARE ( [和 参数 1 类 型 ] [ ,参数 2 类 型 ]…… [ ,参数 N 类 型 ] ); 

其 中 和 中 表示 必须 要 的 字段 ，[] 中 包含 的 是 可 选 字段 。 

类 型 表示 函数 返回 值 的 类 型 ， 它 可 以 是 基本 类 型 ， 也 可 以 是 程序 员 自 定义 的 扩展 类 型 (数组 
除外 )， 其 至 是 空 类 型 ， 没 有 返回 值 的 函数 ， 必 须 将 函数 的 返回 值 定义 为 void 类 型 。 

函数 名 可 以 是 任何 没有 在 程序 中 出 现 过 的 有 效 标 识 符 。 

紧 跟 在 涵 数 名 后 面 插 号 里 的 字段 ， 是 函数 参数 的 类 型 ， 它 们 用 逗号 分 隔 。 每 个 参数 类 型 后 面 
可 以 跟 变 量 ， 例 如 下 面 声 明 的 函数 可 能 是 用 于 计算 一 个 数组 的 平均 值 ， 


int Average(int numbers[], int howMany); 
D.5 运算 符 

这 一 节 描 述 C 语 言 的 运算 符 ， 这 些 运 算 符 都 是 按照 它们 的 用 法 来 分 类 。 
D.5.1 赋值 运算 符 


C 语 言 提供 了 多 种 赋值 运算 符 ， 其 中 最 基本 的 是 “=”， 赋 值 运算 的 顺序 是 从 右 到 左 。 
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下 面 是 一 个 简单 的 赋值 运算 的 标准 形式 : 

(ERER) = { 右 表达 式 } 

左 表 达 式 必须 是 可 以 修改 的 对 象 ， 它 不 能 为 一 个 函数 、 一 个 const 类 型 的 变量 或 者 一 个 数组 
(但 可 以 是 数组 的 一 个 元 素 )。 左 表达 式 也 称 为 左 值 ， 它 可 以 是 一 个 结构 体 或 者 联合 体 变量 。 

当 赋 值 运算 执行 完毕 后 ， 左 表达 式 变量 就 具有 了 访 表 达 式 的 值 。 在 绝 大 多 数 赋 值 运算 中 ， 左 
表述 式 和 右 表达 式 都 具有 相同 的 类 型 ， 如 果 它 们 的 类 型 不 同 ， 那 么 右 操 作 数 将 转换 为 左 操作 数 的 
类 型 后 ， 再 进行 赋值 运算 。 

除了 “=” 外 ， 还 有 如 下 的 一 些 赋值 运算 符 : 


+ 二 = *- /= $- &- |= = <<= >>= 


这 些 赋值 运算 符 可 以 看 做 是 简单 赋值 运算 符 ”=” 和 相应 的 算术 运算 符 的 合成 。 即 A ope BE 
价 于 A = A op (B)。 例 如 x += y 和 x = x+y 的 结果 是 相同 的 。 
其 他 赋值 运算 符 的 例子 ， 可 以 在 12.3.2 节 中 找到 。 


D.5.2 算术 运算 符 
C 语 言 支持 下 列 基本 的 二 元 算术 运算 符 : 
+ - . / % 


它们 分 别 是 加 、 减 、 乘 、 除 和 取 模 运算 。 这 些 和 运算 符 常常 使 用 基本 类 型 (int、double、float 和 
char) 作为 操作 数 。 如 果 操 作 数 具有 不 同类 型 的 值 (比如 一 个 浮 点 数 加 上 一 个 整数 )， 那 么 目标 表 
达 式 将 按照 转换 规则 ( 见 D.5.11 节 ) 进行 转换 。 但 是 有 一 个 例外 ， 取 模 运 算 符 的 操作 数 ， 必 须 是 一 
个 整数 〈 例 如 整数 类 型 、 字 符 类 型 、 枚 举 类 型 等 ) 。 

加 、 减 运算 符 还 可 以 用 指向 数组 元 素 的 指针 作为 操作 数 ， 这 时 候 ， 加 、 减 运算 也 称 为 指针 运 
算 。 例 如 ， 如 果 ptr 是 一 个 指针 类 型 变量 type* ， 那 么 表达 式 ptr+1 就 等 价 于 ptr+sizeof(type)， 即 数组 
下 一 个 元 素 的 地 址 。 

C 语 言 还 支持 一 元 运算 符 + 和 -， 在 操作 数 前 面 加 上 负 号 “- ”将 得 到 该 操作 数 的 相反 数 。 在 操 
作 数 前 面 加 上 正 号 “+” 即 得 到 该 操作 数 本 身 。C 语 言 包 含 “+” 仅 仪 是 为 了 和 “一 ”对 应 。 

更 多 使 用 算术 运算 符 的 例子 ， 可 以 参考 12.3.3 节 。 


D.5.3 位 运算 符 
C 语 言 支持 位 操作 ， 下 列 是 位 操作 的 运算 符 : 
& | ^ - 


位 运算 符 只 能 以 整数 作为 操作 数 ， 浮 点 数 不 能 用 于 位 操作 。 

运算 符 “<<” 和 “>>” 分 别 表示 左 移 和 右 移 运算 。 左 边 的 是 要 移动 的 操作 数 ， 右 边 的 是 移动 
的 位 数 。ANSI C 中 ， 设 有 定义 要 移动 的 位 数 大 于 左边 操作 数位 长 度 (比如 把 一 个 32 位 整数 移动 33 
位 )， 以 及 要 移动 的 位 数 是 负数 的 情况 ， 这 两 种 情况 下 ， 得 到 的 结果 是 不 定 的 。 

表 D-2 给 出 了 这 些 位 操作 的 例子 ， 并 给 出 了 当 操 作 数 x= 186. y = 6 时 的 运算 结果 。 


表 D-2 C 语 言 中 的 位 操作 符 


操作 符 操作 例子 x-186, y=6 
& 按 位 与 x&y 2 

| 按 位 或 xly 190 

~ 按 位 取 反 ~x -187 

^ 按 位 异 或 x^y 188 

<< 左 移 X<<y 11904 


>> 右 移 x>>y 2 
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D.5.4 逻辑 运算 符 

在 C 语 言 里 , 我们 可 以 使 用 逻辑 运算 符 将 多 个 逻辑 子 句 连接 起 来 ， 构 成 一 个 逻辑 表达 式 。 例 如 ， 
我 们 想 测试 条 件 A 和 条 件 B 是 否 均 为 真 ， 我 们 只 需要 用 逻辑 “与 ”将 A 和 B 连 接 起 来 即 可 。 

远 辑 “与 ”是 二 元 运算 符 。 当 且 仅 当 还 辑 “ 与 ”连接 的 所 有 子 句 均 为 “ 真 ” 时 ， 整 个 表达 式 
才 为 “ 真 。 . 

逻辑 “或 ”也 是 二 元 运算 符 。 当 且 仅 当 逻 辑 “ 或 ”连接 的 所 有 子 句 均 为 “ 假 ”时 ， 整 个 表达 
AC "RA. 

逻辑 “ 非 ” 是 一 元 运算 符 。 当 操作 数 是 逻辑 “ 真 ”时 ， 表 达 式 为 “ 假 "， 反 之 ， 表 达 式 为 “ 真 ”。 

逻辑 “与 ”和 “或 ”是 “短路 ”(short-circuit) 操作 符 ， 即 如 果 逻 辑 表达 式 左 边 的 子 句 能 够 决 
定 判 断 条 件 ， 那 么 表达 式 右 边 的 子 句 就 不 再 计算 ， 这 将 带 来 “副作用 ”。 例 如 表达 式 “xlly++” 中 ， 
如 果 x 非 0， 则 y++ 子 句 将 不 会 执行 。 

表 D-3 列 出 了 多 辑 运算 符 的 用 法 。 为 了 和 位 运算 符 比较 ， 仍 取 操 作 数 x 二 186,，y=6。 


表 D-3 C 语 言 中 的 逻辑 操作 符 


操作 符 B 作 例子 x=186, y=6 
&& 逻辑 与 x&&y 1 
I 逻辑 或 xlly 1 
逻辑 非 Ix (0 
D.5.5 关系 运算 符 
下 列 运算 符 ; 
== l= > >= < <= 


是 C 语 言 的 关系 运算 符 ， 它 们 用 来 比较 左 操作 数 和 右 操作 数 之 间 的 关系 ， 比 如 “相等 "、“ 不 相 
等 "`、“ 大 于 ”等 。 如 果 关 系 成 立 ， 则 返回 逻辑 “ 真 ”， 否 则 返回 逻辑 “ 假 "。 当 左 操作 数 和 右 操作 
数 类 型 不 匹配 时 ， 会 发 生 类 型 转换 ， 详 见 D.5.11 节 。C 语 言 允 许 指针 作为 关系 运算 符 的 操作 数 ， 但 
是 只 有 在 两 个 指针 指向 相同 对 象 时 才 有 意义 。 


D.5.6 增 量 / 减 量 操作 符 


C 语 言 使 用 符号 “++” 和 “一 一 ”作为 增 量 和 减 量 操 作 符 ， 它 们 都 是 一 元 运算 符 ， 对 操作 数 做 
“加 1” 或 “ 减 1” 运 算 。“++” 和 “一 一 ”可 以 放 在 操作 数 的 前 面 ， 也 可 以 放 在 操作 数 的 后 面 。 

作为 前 缀 时 ， 操 作 数 先进 行 “ 加 1” 或 “ 减 1” 运 算 ， 然 后 才 将 操作 数 的 值 作为 表达 式 的 值 。 
例如 下 面 代码 执行 后 : 


int x = 4; 
int y; 


Y = ++X; 


x 和 y 都 等 于 5， 
作为 后 组 时 ， 先 以 操作 数 的 值 作为 表达 式 的 值 ， 然 后 再 对 操作 数 进行 “加 1” 或 “ 减 1” 运 算 ， 


例如 下 面 代码 运行 后 : 
int x = 4; 
int Y; 


y = X++; 


CRER 


= 
[4 


Xx 等于， 而 y 等 于 4 
运 


D.5.7 条 件 表达 式 
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和 加 减 运 算 类 似 ， 增 量 和 减 量 运算 也 可 以 用 指针 作为 操作 数 ，D.5.2 给 出 了 一 个 例子 
C 语 言 里 的 条 件 表达 式 如 下 : 

{表达 式 A) ? {表达 式 B): {表达 式 C) 

当 表 达 式 A 为 逻辑 “ 真 ”时 SAX 

逻辑 “ 假 ” 时 ， 整 个 条 件 表达 式 的 值 就 等 于 表达 式 C 的 值 。 例 如 ， 下 面 的 代码 段 
w=x? y z; f 

表达 式 x ? y : z 的 值 取决 于 x 的 值 ， 如 果 x 非 0 


整个 条 件 表达 式 的 值 等 于 表达 式 B 的 值 ， 反 之 ， 如 果 表 达 式 A 为 
特性 ， 见 D.5.4 节 。 


则 y 将 对 w 进 行 巍 值 ， 否 则 z 将 对 w 进 行 赋值 
条 件 表达 式 也 具有 人 逻辑 运算 符 的 “短路 ”特性 ， 表 达 式 B 和 表达 式 C 能 否 得 到 执行 ， 取 决 于 表 
达 式 A 的 值 。 如 果 x 非 0， 表 达 式 z 将 不 会 执行 ， 如 果 x 的 值 为 0， 表 达 式 y 就 不 会 执行 。 关 于 “短路 ” 
D.5.8 指针 、 数 组 和 结构 体 
这 里 介绍 和 扩展 类 型 一 起 使 用 的 与 地 址 相关 的 操作 符 
1. 取 址 运算 符 
取 址 运算 符 是 及， 它 返 回 操作 数 的 内 存 地 址 ， 这 就 要 求 操作 数 必须 是 一 个 内 存 对 人 象 ， 例如 变量 
数组 元 素 或 者 结构 体 成 员 。 . 
2. 间接 引用 运算 符 
间接 引用 运算 符 是 取 址 运算 符 的 补充 。 它 以 地 址 作为 操作 数 
下 面 的 代码 : 
int tp; 
int X = 5; 
P = &x; 


*p = *p + 1; 


回 该 地 址 指向 的 对 象 。 例 如 
表达 式 *p 返 回 x 的 值 。 当 *p 出 现在 赋值 运算 符 的 左边 时 ， 它 可 以 看 做 一 个 左 值 ， 否 则 它 仅仅 返 
回 它 指向 变量 的 值 
3. 数组 引用 
CARRE., As UD" BB 

来 指明 访问 的 数组 元 素 。 下 面 是 一 个 数组 引用 的 例子 

int x; 

int list [100] 


里 的 表达 式 用 于 指定 数组 的 下 标 
是 一 人 


x = listí[x + 10] 


. 结构 体 和 联合 体 引 用 


操作 符 通常 和 数组 名 一 起 使 用 
OMNES TREE, 用 于 引用 结构 体 和 联合 体 的 成 员 。 第 一 个 操作 符 是 “."， 结 构 体 或 
联合 体 变量 可 以 直接 使 用 它 来 引用 自己 的 成 员 。 下 面 是 一 个 “ 

struct pointType { 

int x; 

int y 

li sedef pointType Point 

Point pixel 
pixel.x = 3; 


操作 符 的 例子 ， 
pixel.y = pixel.x + 10 


394 NH XD 





pixel 是 一 个 结构 体 变 量 ， 可 以 通过 “.” 操 作 符 直接 引用 它 的 成 员 。 
第 二 个 操作 符 是 “->”， 结 构 体 或 联合 体 的 指针 ， 可 以 通过 它 来 直接 引用 该 指针 指向 变量 的 成 
员 。 下 面 是 一 个 “->” 操 作 符 的 例子 : 


Point pixel; 
Point *ptr; 


ptr - &pixel; 
ptr-»x = ptr-»x + 1; 


其 中 ，ptr 是 指向 结构 体 变量 pixel 的 指针 。 


D.5.9 ”sizeof 操作 符 


操作 符 sizeof 返 回 存 储 一 个 指定 类 型 的 对 象 所 需要 的 字 节 数 。 例 如 ，sizeof(int) 返 回 一 个 整 型 数 
需要 占据 的 字 节 数 ， 当 操作 数 是 一 个 数组 时 ，sizeof 返 回 数组 的 大 小 ， 如 下 例 所 示 : 
int list [45]; 
struct example type [ 
int valueA; 
int valueB; 


double valueC; 


typedef struct example type Example; 


sizeA = sizeof(list); /* 45 * sizeof(int)  */ 
sizeB = sizeof (Example); /* Size of structure */ 


D.5.10 运算 顺序 
C 语 言 表达 式 的 运算 是 一 个 顺序 进行 的 过 程 。 如 果 表 达 式 中 有 括号 ， 则 首先 计算 括号 内 的 表 
达 式 。 如 果 没 有 括号 ， 则 按照 C 语 言 定义 的 运算 符 优 先 级 ， 先 计算 优先 级 高 的 表达 式 。 如 果 表 达 
式 中 出 现 相同 优先 级 的 运算 符 ， 则 按照 C 语 言 定 义 的 关联 顺序 从 左 到 右 或 从 右 到 左 依次 计算 。 
表 D-4 给 出 了 C 语 言 运算 符 的 优先 级 和 关联 顺序 ， 最 高 优先 级 的 运算 符 在 表 的 顶部 。 


表 D-4 操作 符 的 优先 关系 ,括号 内 是 该 操作 符 的 描述 


优先 级 关联 顺序 操作 符 

1( 最 高 ) 从 左 到 右 0O( 函 数 调用 ) [1 数组 下 标 ) . -> 

2 从 右 到 左 ++ 一 一 (后缀 ) 

3 MEFE ++ 一 一 (前 级 ) 

4 从 右 到 左 *( 间 接 引 用 ) &( 取 地 址 ) +( 一 元 运算 ) 一 (一 元 运算 ) 
~ ! sizeof 

5 从 右 到 左 强制 类 型 转换 

6 从 左 到 右 *(GER) / 96 

7 从 左 到 右 +{( 加 法 ) - (减法 ) 

8 AESA << >> 

9 从 左 到 右 < > <= >= 

10 从 左 到 右 == l= 

H AERA &(i 5) 

12 MESA ^ 

13 从 左 到 右 | 

14 AESA && 

15 AESA ll 

16 从 左 到 右 ?: (条 件 运算 符 ) 


17( 最 低 ) 从 右 到 左 = += 一 =+= 等 
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D.5.11 类 型 转换 
考虑 一 个 使 用 操作 符 op 的 表达 式 : 


A op B; 

该 表达 式 运算 结果 的 类 型 取决 于 : (04) 操作 数 4、8 的 类 型 ， (2) 操作 符 op 的 特性 。 

假如 操作 数 4 和 8 有 相同 的 类 型 ， 而 且 操 作 符 op 能 够 以 该 类 型 变量 作为 操作 数 ， 则 该 表达 式 运 
算 结 果 的 类 型 是 由 操作 符 op 决 定 的 。 

当 表 达 式 中 的 变量 类 型 各 不 相同 时 ，C 语 言 将 对 操作 数 进行 类 型 转换 。 一 般 而 言 ， 类 型 转换 都 
是 将 占 比 特 数 较 少 的 类 型 转换 为 占 比 特 数 较 多 的 类 型 ， 比 如 将 整数 类 型 转换 为 浮 点 数 类 型 。 假 如 
上 面 例子 中 4 为 浮 点 数 类 型 ， 而 8 为 整数 类 型 ,操作 结果 将 是 浮 点 数 类 型 。 像 字符 类 型 、 枚 举 类 型 、 
整数 类 型 等 整数 类 型 的 值 ， 都 转换 为 整数 类 型 (或 者 无 符号 整 型 ， 这 是 和 编译 器 相关 的 )。 下 面 给 
出 一 些 类 型 转换 的 例子 : 


char i; 


j /* This expression is an integer */ 
1 /* This expression is an integer 
1.0 /* This expression is a float 
1.0 /* This expression is a float 
Y 


*/ 
*/ 
*/ 
/* This expression is a double */ 
j+x+y /* This is a double */ 


EE (2) 提 到 ，-- 些 操作 符 需 要 特定 的 类 型 作为 它 的 操作 数 ， 或 者 得 到 的 结果 是 特定 的 类 型 。 
例如 取 模 运算 符 % 只 能 用 整数 类 型 作为 它 的 操作 数 ， 这 样 ， 其 他 类 型 的 操作 数 ( 比 如 char 类 型 ) 都 将 转 
换 为 整数 类 型 。 浮 点 数 类 型 不 能 转换 为 整数 类 型 ， 因 此 用 浮 点 数 作 为 % 的 操作 数 将 产生 编译 错误 。 

如 果 将 一 个 浮 点 数 转换 为 整数 类 型 (这 种 情况 不 会 发 生 在 自动 类 型 转换 时， 但 是 可 能 发 生 在 
强制 类 型 转换 时 ， 强 制 类 型 转换 在 下 一 节 介 绍 )， 它 的 小 数 部 分 将 会 丢失 ， 而 且 如 果 整 数 类 型 不 能 
表示 该 浮 点 数 的 整数 部 分 时 ， 转 换 的 结果 是 不 定 的 。 

强制 类 型 转换 

程序 员 可 以 通过 强制 类 型 转换 (type casting) 来 控制 类 型 的 转换 过 程 。 强 制 类 型 转换 的 一 般 
形式 如 下 : 

(新 类 型 ) 表 达 式 

这 里 的 表达 式 将 按照 前 面 介绍 的 转换 规则 转换 为 新 的 类 型 ， 下 面 是 一 个 例子 ， 

j= (int)x + y;  /* 结 果 的 双 精 度 浮 点 类 型 将 转换 为 整数 类 型 */ 


D.6 表达 式 和 语句 

C 语 言 里 ， 程 序 完成 的 任务 是 由 函数 体内 的 表达 式 和 语句 来 描述 的 。 
D.6.1 表达 式 

表达 式 是 由 常量 、 变 量 、 操 作 符 和 函数 调用 组 成 的 序列 ， 该 序列 能 够 产生 一 个 特定 类 型 的 值 。 
表达 式 按照 操作 符 的 运算 优先 级 和 关联 顺序 进行 求 值 ( 见 D.5.10 节 ) ， 求 得 值 的 类 型 取决 于 表达 式 
的 各 个 元 素 和 类 型 转换 规则 ( 见 D.5.11 节 )。 如 果 表 达 式 的 每 个 元 素 都 是 整数 类 型 ， 那 么 这 个 表达 
式 就 是 整数 类 型 。 下 面 是 几 个 表达 式 的 例子 : 


a*a+b*Db 
att -c/3 

a <= 4 

q |] integrate (x) 
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D.6.2 i&fy 


C 语 言 里 ， 简 单 的 语句 就 是 以 分 号 C) 结束 的 表达 式 ， 通 常 ， 语 句 除了 对 表达 式 求 值 外 ， 还 
有 其 他 副作用 ， 比 如 对 变量 值 进行 修改 。 一 条 语句 执行 完成 后 ， 下 面 一 条 语句 就 继续 执行 。 当 函 
数 的 最 后 一 条 语句 执行 完成 后 ， 整 个 函数 就 结束 了 。 下 面 是 两 个 简单 语句 的 例子 ，; 


C-a*a«t*b*b; /* Two simple statements */ 
b = a++ -cec/ 3; 


复合 语句 (或 代码 块 ) 由 包含 在 括号 “{}” 里 的 几 条 相关 的 语句 组 成 。 从 语法 角度 上 讲 ， 复 
合 语句 和 简单 语句 是 一 样 的 ， 它 们 可 以 互相 替代 。 例 如 ， 下 面 的 复合 语句 和 上 面 的 两 条 语句 是 一 
FERI: . 


{ /* One compound statement * 
p 


D.7 控制 结构 
程序 员 可 以 通过 控制 结构 来 实现 程序 的 条 件 执行 或 循环 执行 。 
D.7.1 if 语句 


这 语句 的 格式 如 下 : 


if (expression) 
statement 


expression 可 以 是 任何 基本 类 型 、 枚 举 类 型 或 指针 类 型 的 表达 式 。 当 expression 的 值 不 为 0 时 , 
statement 就 会 执行 。statement 可 以 是 简单 语句 ， 也 可 以 是 复合 语句 。 例 如 ， 


if (x < 0) 
a = b+ c; /* Executes if x is less than zero */ 


在 13.2.1 节 ， 有 更 多 关于 让 语句 的 例子 。 
D.7.2 if-else 语 名 
if-else 语 名 的 格式 如 下 ; 


if (expression) 
statementl 

eise 
statement2 


同样 ，expression 可 以 是 任何 基本 类 型 、 枚 举 类 型 或 指针 类 型 。 当 expression 的 值 不 为 0 时 ， 就 执 
行 statement1 语 句 ， 否 则 执行 statement2 语 句 。statement1 和 statement2 都 可 以 是 简单 语句 或 复合 语句 。 


if (x < 0) 
a= b+ c; /* Executes if x is less than zero */ 


else . 
a=b ~ c; /* Otherwise, this is executed.  */ 


在 13.2.2 节 ， 有 关于 if-else 语 句 的 更 多 例子 。 
D.7.3 Switch 语句 


switch 语 句 的 格式 如 下 : 


switch(expression) { 

case const -expri H 
StatementlA 
StatementliB 
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case const-expr2: 
Statement2A 
statement2B 


case const-exprN: 
statementNA 
statementNB 


) 
switch 语 句 由 一 个 整 型 表达 式 ( 见 D.3.1 节 ) 和 紧 随 其 后 的 复合 语句 (虽然 并 不 要 求 是 复合 语 


句 ， 但 几乎 始终 是 复合 语句 ) 组 成 ， 这 个 复合 语句 中 有 一 个 或 多 个 case 标 志 ， 每 个 标志 后 面 紧 跟 一 
个 整 型 常量 表达 式 (例如 上 面 例子 中 的 const-exprl1、const-expr2、const-exprN) 。 在 一 个 switch 语 
名 中 ， 每 个 case 标 志 后 面 的 常量 表达 式 ， 必 须 是 互 不 相同 的 。 

当 执 行 到 一 个 switch 语 名 时 ， 首 先 计算 switch 后 面 的 表达 式 expression。 如 果 该 表达 式 的 值 和 某 
个 case 标 志 后 面 的 常量 表达 式 的 值 匹 配 ， 程 序 就 跳 转 到 该 case 标 志 后 面 的 语句 开始 执行 。 

default 是 一 个 特殊 的 标志 ， 它 用 来 匹配 那些 和 其 他 case 标 志 都 不 匹配 的 情况 。 如 果 switch 语 句 
中 没有 default 标 志 ， 而 且 表 达 式 的 值 和 每 一 个 case 都 不 匹配 时 ，switch 中 的 语句 都 不 会 执行 。 

下 面 是 使 用 switch 语 名 的 一 个 例子 。 程 序 执行 时 如 果 遇 到 break ， 将 跳出 switch 语 句 。 想 了 解 
break 的 更 多 信息 ， 可 以 参考 D.7.7 节 。 


char k; 





k = getchar(); 
switch (k) { 


break; /* break causes control to leave switch */ 


13.5.1 节 有 更 多 关于 switch 语 句 的 例子 。 
D.7.4 ” while 语句 
while 语 句 的 格式 如 下 : 


while (expression) 
Statement 


while 是 一 个 循环 控制 结构 。 当 表达 式 expression 的 值 不 为 0 时 ， 就 执行 语句 statement， 当 
statement 执 行 完 成 后 ， 并 不 执行 后 面 的 语句 ， 而 是 重新 跳 转 到 while 语 名 的 开始 ， 并 计算 expression 
的 值 。 这 个 过 程 重复 执行 ， 直 到 表达 式 expression 的 值 为 0 为 止 ， 然 后 才 开 始 执 行 while 后 面 的 一 条 
语句 。statement 可 以 是 一 个 简单 语句 ， 也 可 以 是 复合 语句 。 

下 面 的 例子 中 ，while 语 句 将 循环 100 次 。 
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x20; 

while (x < 100) { 
printf ("x = ļ$d\n", x); 
X =X+ 1; 


) 
13.3.1 节 有 更 多 关于 while 语 名 的 例子 。 


D.7.5 for 语 名 
for 语 名 的 格式 如 下 : 


for (initializer; term-expr; reinitializer) 
Statement 


foer 语 句 也 是 一 个 循环 结构 。 表 达 式 initializer 在 进入 循环 之 前 执行 ， 而 且 仅 执行 一 次 。 表 达 式 
term-expr 则 是 在 每 次 循环 开始 时 执行 ， 如 果 计 算 term-expr 得 到 非 0 值 ， 那 么 继续 执行 循环 体 ， 否 则 
跳出 循环 。 语句 statement 在 每 次 循环 时 都 会 执行 ， 当 statement 执 行 完 成 后 ， 将 执行 语句 reinitializer。 
这 个 过 程 一 直 重 复 ， 直 到 term-expr 表 达 式 的 值 等 于 0 时 为 止 。 

下 面 for 语 名 的 例子 ， 将 循环 执行 100 次 : 


for (x = 0; x < 100; X++) { 
printf ("x = $dMn", x); 


13.3.2 节 有 更 多 关于 for 循 环 的 例子 。 
D.7.6 do-whilei& 4 
do-while 语 名 的 格式 如 下 : 


do 
Statement 
while (expression); 


do-while 语 名 和 while 语 名 非常 相似 。 当 遇 到 do-while 语 杀 时 ， 首 先 执行 循环 体 statement， 然 后 
计算 表达 式 expression 的 值 。 如 果 计 算得 到 的 值 非 0， 那 么 继续 进行 下 一 次 循环 ， 否 则 跳出 循环 。 
do-while 语 名 的 特点 是 至 少 执 行 一 次 循环 。 

下 面 是 循环 100 次 的 do-while 语 句 的 例子 : 

do 

printf ("x = &dWMn", x); 


xX-2X-41; 


while (x « 100); 


13.3.3 节 有 更 多 关于 do-while 语 名 的 例子 。 
D.7.7 break 语 名 


break 语 名 的 格式 如 下 : 

break, 

break 语 句 只 能 用 在 循环 或 switch 结 构 中 ， 如 果 程 序 在 执行 过 程 中 遇 到 break 语 句 ， 程 序 将 跳出 
最 近 一 次 循环 。 


下 面 例子 中 ，break 语 句 将 结束 for 循 环 ， 


for (x = 0; x < 100; x««) { 


if (error) 
break; 
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13.5.2 节 有 关于 break 语 名 的 更 多 例子 。 
D.7.8 continue 语句 


continue 语 句 的 格式 如 下 : 

continue; 

continue 语 名 只 能 用 在 循环 结构 中 ， 它 立即 结束 当前 的 一 次 循环 ， 并 回 到 循环 的 开始 ， 重 新 计 
算 循 环 条 件 ， 以 决定 是 否 进行 下 一 次 循环 。 在 for 语 句 中 ， 如 果 遇 到 continue 语 名 ， 程 序 在 进行 下 一 
次 循环 前 ， 会 先 执行 reinitializer 语 句 。 下 面 给 出 一 个 for 循 环 的 例子 : 

for (x = 0; x < 100; x++} { 

if (skip) 

} H 

在 这 段 代 码 中 ， 如 果 continue 语 句 执行， 表达 式 x++ 也 将 会 执行 ， 然 后 再 计算 循环 和 条件， 决定 
是 否 进行 下 一 次 循环 。 

13.5.2 节 有 关于 continue 语 句 的 更 多 例子 。 
D.7.9 return 语 向 


returm 语 名 的 格式 如 下 : 

return expression; 

return 语 旬 将 结束 当前 函数 的 执行 ， 并 返回 到 调用 函数 。 当 函数 执行 完 最 后 一 条 语句 后 ， 也 会 
隐 式 地 插入 一 条 return 语 句 ， 返 回 到 调用 程序 。 

return 后 面 的 表达 式 是 函数 的 返回 值 ， 它 将 转换 为 函数 的 返回 类 型 。 当 和 函数 需要 返回 值 ， 但 函 
数 并 没有 任何 产生 返回 值 的 语句 时 ， 国 数 返 回 的 值 是 不 定 的 。 下 面 是 return 语 名 的 一 个 例子 ， 


return xty; 


D.8 预 处 理 


源 代 码 在 编译 前 ， 还 包含 一 个 修改 的 过 程 ， 这 个 过 程 是 由 程序 员 控制 的 ， 在 C 语 言 里 称 为 预 处 理 。 
最 常用 的 预 处 理 包括 宕 替换 和 头 文件 包含 。 宏 蔡 换 克 许 程序 员 用 一 个 文本 序列 替换 另 一 个 序 

列 ， 头 文件 包含 是 指 将 头 文件 的 内 容 包含 到 源 文 件 中 。 本 市 后 面 将 详细 描述 这 两 个 预 处 理 指令 。 
预 处 理 指令 不 是 C 语 句 ， 因 此 它们 不 需要 使 用 分 号 来 表示 一 条 指令 的 结束 。 


D.8.1 zii 
预 处 理 器 将 用 #define 预 处 理 指 令 将 指定 的 字符 序列 替换 为 另 一 个 。 例 如 
fdefine A B 


这 样 ， 源 程序 里 和 A 匹 配 的 字符 序列 将 被 B 替 换 。 但 是 需要 注意 ， 只 有 独立 的 字符 序列 才 会 被 
替换 。 例 如 标识 符 APPLE 中 的 A 不 会 被 B 替 换 ， 双 引号 里 的 字符 串 常量 ， 例 如 “A”， 也 不 会 被 替换 。 

替换 文本 包括 后 续 的 整 行 ， 如 果 替 换文 本 很 长 ， 可 以 用 ”\” 符 号 将 多 行 连接 在 一 起 。 

宏 可 以 带 参 数 ， 其 参数 在 宏 后 面 的 括号 里 指定 。 例 如 : 


define REMAINDER(X, Y) ((X)8(Y)) 


源 代码 里 的 宏 REMAINDER 后 面 ， 需 要 两 个 表达 式 作为 宏 的 参数 ， 例 如 : 
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valueC = REMAINDER(valueA, valueB+15); 
BREER 28 E HifidefinefizE BJ ERR CAE ER BRIALZ:, HEERE E LH BL E ORCE SOCII 
Y。 前 面 的 代码 在 预 处 理 后 将 生成 下 面 的 代码 : 


valueC = ((valueA) $ (valueB*15)); 
注意 ， 宏 定义 时 X 和 YY 外面 的 括号 不 能 省 略 。 否 则 ， 由 于 多 比 + 的 优先 级 高 ， 上 面 的 替换 将 会 
产生 错误 。 


带 参数 的 宏 在 形式 上 和 函数 调用 很 相似 ， 但 是 宏 不 会 引入 一 般 函 数 调用 时 所 产生 的 开销 。 


D.8.2 头 文件 包含 


预 编译 指令 贡 nclude 的 作用 是 将 一 个 头 文 件 的 内 容 插入 到 产 代 码 文件 中 。C 程 序 的 头 文件 一 般 
只 包含 一 系列 的 宏 定 义 和 国 数 的 声明 。 
#include 预 处 理 指令 有 下 面 两 种 形式 : 


#include <stdio.h> 
#include "program.h" 


第 一 种 情况 是 在 尖 括 号 “<>” 里 指明 包含 的 头 文件 。 这 种 情况 下 ， 编 译 器 仅仅 搜索 环境 变量 中 
“指定 的 头 文件 目录 ， 来 查找 该 头 文件 ， 这 个 头 文件 目录 一 般 是 系统 定义 好 的 ， 在 该 目录 下 包含 了 许 
多 系统 相关 和 其 他 库 相 关 的 头 文件 。 第 二 种 情况 是 在 双 引 号 内 指明 包含 的 头 文件 ， 这 种 情况 下 ， 编 
译 器 将 首先 搜索 包含 源 文件 的 目录 ， 如 果 没 有 找到 ， 则 继续 搜索 环境 变量 中 定义 好 的 头 文件 目录 。 


D.9 标准 库 函 数 


ANSI C 标 准 定义 了 150 多 个 标准 库 函 数 ， 程 序 可 以 使 用 它们 来 完成 不 同 的 任务 (例如 输入 / 输 
出 和 动态 分 配 内 存 )。 这 些 函 数 都 是 标准 的 ， 因 此 ， 使 用 这 些 函 数 的 程序 可 以 很 容易 地 从 一 个 ANSI 
C 平 台 移 植 到 另 一 个 ANSI C 平 台 。 这 一 节 将 介绍 一 些 有 用 的 库 国 数 。 


D.9.1 输入 /输出 函数 


使 用 标准 输入 /输出 函数 的 代码 ， 必 须 包含 <stdio.h> 头 文件 ， 下 面 是 儿 个 例子 : 

I. getchar 3X 

这 个 函数 的 声明 如 下 : 

int getchar(void) 

getchar 从 标准 输入 设备 stdin 中 读 取 下 一 个 输入 的 字符 ， 并 且 以 该 字符 的 值 作为 函数 的 返回 值 。 

getchar 函 数 和 LC-3 中 的 输入 TRAP 很 相似 ， 只 是 它 不 在 屏 医 上 打印 输入 提示 信息 。 

许多 计算 机 系统 都 使 用 缓 串 1/O 米 实现 getchar， 即 操作 系统 将 缓存 键盘 输入 的 字符 (假定 标准 
输入 是 键盘 )。 一 旦 遇 到 回 车 键 ， 缓存 的 字符 序列 就 加 载 到 输入 流 中 。 

2. putchar% X 

putchar 函 数 的 声明 如 下 ; 

void putchar (int c); 

函数 putchar 和 LC-3 中 的 TRAP OUT 指 令 相 似 ， 它 带 一 个 整 型 数 作为 参数 ， 将 该 值 代表 的 字符 
输出 到 标准 输出 流 中 。 

如 果 标 准 输出 设备 是 显示 器 ， 那 么 我 们 就 可 以 在 显示 器 上 看 到 输出 的 字符 。 但 是 ,现代 计 算 
机 都 使 用 了 缓冲 技术 ， 字 符 要 等 到 缓冲 区 清空 (flushed) 后 才能 在 屏幕 上 出 现 ， 比 如 在 遇 到 回 车 


字符 后 。 


3. scanf fj E 

scanfi& ic HB) PHA T : 

int scanf(const char * formatstring,*ptrl,...); 

scanf 以 一 个 格式 串 和 一 组 指针 作为 它 的 参数 ， 这 个 格式 串 包 含 了 一 系列 转换 格式 声明 ， 这 些 
转换 格式 声明 将 控制 对 输入 流 的 解释 。 例 如 ， 转 换 格 式 声 明 “%d” 控 制 scanf 将 输入 流 中 下 一 个 非 
空 字符 串 解释 为 一 个 十 进 制 整 型 数 ， 这 个 字符 串 首 先 转换 为 整数 ， 然 后 将 其 赋值 给 下 一 个 指针 指 
向 的 变量 。 表 D-5 列 出 了 scanf 使 用 的 转换 格式 声明 ， 格 式 串 后 面 的 指针 参数 个 数 ， 应 该 和 格式 串 中 
的 转换 格式 声明 个 数 相同 。scanf 的 返回 值 表 示 正 确 赋值 的 变量 个 数 。 


表 D-5 scanf 的 转换 格式 声明 








转换 格式 声明 参数 类 型 
%d 有 符号 十 进 制 数 
%i 十 进 制 、 入 进 制 0 开头 ) 或 十 六 进 制 《0x 开头 ) 
ho 八进制 数 
x 十 六 进 制 数 
ou 无 符号 整数 
Obc 字符 
%s 非 空 字符 串 
%f We 浮 点 数 
4. printf i Jk 
printf ARE BH AD P : 


int printf(const char * formatString,...):; 


printf 的 功能 是 将 格式 化 字符 串 写 到 标准 输出 流 中 。 如 果 格 式 串 format string 中 包含 一 个 转换 格 
式 声明 ， 那 么 printf 会 将 后 面 的 参数 解释 为 相应 类 型 值 后 填充 到 输出 流 中 。 例 如 ， 转 换 格式 声明 
“qd” 告 诉 printf， 将 后 面 的 参数 解释 为 一 个 十 进 制 整 数 ， 然 后 将 这 个 整数 插入 到 输出 流 中 。 表 D-6 
列 出 了 printf 使 用 的 一 些 转换 格式 声明 ， 一 般 而 言 ， 格 式 串 后 面 的 参数 ， 应 该 和 格式 申 中 的 转换 格式 
声明 相对 应 。printf 的 返回 值 表 示 写 到 标准 输出 流 中 的 字符 个 数 ， 如 果 直 到 错误 ， 则 返回 一 个 负 值 。 


表 D-6 printf 的 转换 格式 声明 








转换 格式 声明 





转换 格式 声明 












"bd %i 有 符号 整数 96s 字符 串 

%o 八进制 数 %f 十 进 制 形式 的 浮 点 数 
96x WK 十 六 进 制 数 pe WE 指数 形式 的 浮 点 数 
Yu 无 符号 整数 Pp 指针 





%c 字符 






D.9.2 字符 串 函 数 


C 标 准 库 里 包含 了 大 约 15 个 与 字符 串 相 关 的 标准 库 函 数 。 要 使 用 这 些 函 数 ， 必 须 在 源 文件 里 包 
含 <string.h> 头 文件 。 这 一 节 我 们 讨论 其 中 的 两 个 函数 。 

1. stremp fs X 

stremp& E H9 E HEAT : 


int strcmp(char * stringA, char * stringB); 
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这 个 国 数 用 来 比较 两 个 字符 串 ， 如 果 字 符 串 stringA 和 stringB 相 等 ， 函 数 返 回 0。 如 果 stringA 大 
于 stringB， 返 回 一 个 正 数 。 如 果 stringA 小 于 stringB， 则 返回 一 个 负数 。 这 里 的 比较 是 基于 字典 排 
序 的 ， 即 在 字典 里 靠 后 的 字符 串 大 于 它 前 面 的 字符 串 。 

2. strcpy% X 

strcpy 的 函数 声明 如 下 : 

char * strcpy(char * stringA, char * stringB); 

这 个 函数 将 字符 串 stringB 复 制 给 stringA( 包 括 字 符 串 结束 符 )， 如 果 没 有 遇 到 错误 ， 它 将 返回 一 
个 指向 stringA 的 指针 。 


D.9.3 数学 函数 


C 标 准 库 函 数 中 包含 了 一 些 常 用 的 数值 运算 , 使 用 它们 时 需要 包含 <math.h> 头 文件 。 在 这 一 节 中 ， 
我 们 列 出 了 一 部 分 关于 双 精 度 浮 点 运算 的 函数 ， 它 们 都 以 double 类 型 作为 参数 ， 返 回 类 型 也 是 double: 


double sin(double x); /* sine of x, expressed in radians */ 
double cos (double x); /* cosine of x, expressed in radians */ 
double tan(double x); /* tan of x, expressed in radians */ 
double exp (double x); /* exponential function, e’x */f 
double log(double x); /* natural log of x */ 
double sqrt (double x);  /* square root of x */ 


double powí(double x, double y) /* x^y -- x to the y power */ 


D.9.4 其 他 有 用 的 函数 


除了 上 面 列 出 的 函数 外 ，C 标 准 库 中 还 包含 其 他 一 些 非常 重要 的 函数 ， 例 如 内 存 分 配 、 数 据 转 
换 、 排 序 等 。 使 用 这 些 函数 时 ， 只 要 包含 头 文 件 <stdlib.h> 即 可 。 

1. malloc i£ 3X. 

正如 19.3 节 所 述 ，malloc 函 数 分 配 一 个 固定 大 小 的 内 存 块 ， 它 的 声明 如 下 : 

void * malloc(size t size); 

卫 数 参数 size 表 示 要 分 配 内 存 的 大 小 ， 以 字 节 为 单位 。 参 数 类 型 是 size_t， 和 操作 符 sizeof 的 返 
回 值 一 样 (一 般 情况 下 ， 都 是 unsigned int 类 型 ) 。 如 果 分 配 成 功 ， 则 返回 一 个 指向 该 内 存 块 的 指针 ， 
车 分 配 失败 ， 则 返回 一 个 空 指针 NULL。 

2. free fo 

free 的 函数 声明 如 下 : 

void free(void * ptr); 

函数 free 释 放 前 面 分 配 的 堆 (heap) 内 存 区 ， 这 个 内 存 区 的 地 址 由 指针 pt 指定。 但 是 需要 注意 ， 
ptr 指 问 的 内 存 区 段 必 须 是 前 面 动态 分 配 的 ， 否 则 会 发 生 错 误 。 

3. randfesrand., X 

C 标 准 库 中 还 包括 一 个 产生 随机 序列 的 函数 ， 称 为 rand。 但 是 它 并 不 能 产生 真正 的 随机 序列 ， 
我 们 称 之 为 伪 随 机 序列 。 该 序列 由 初始 的 种 子 (seed) 值 决 定 ， 当 种 子 改变 时 ， 序 列 也 就 改变 了 。 
例如 ， 当 种 子 是 10 时 ， 得 到 的 随机 序列 将 是 相同 的 ， 但 是 这 个 序列 和 别 的 种 子 产 生 的 序列 是 不 同 的 。 

函数 rand 的 声明 如 下 ，; 

int rand(void) 

该 孙 数 返回 一 个 伪 随 机 整数 ， 这 个 随机 数 的 范围 在 0 和 RAND_MAX 之 间 。RAND_MAX 是 系 
统 定义 的 宏 ， 该 值 最 小 为 32 767, 

为 了 设置 伪 随 机 序列 的 种 子 ， 我 们 可 以 使 用 srand 函 数 。 该 函数 的 声明 如 下 : 


void srand(unsigned int seed); 


E.1 常用 数字 前 缀 


表 E-1 KFAR 
数值 二 进 制 近似 值 前 组 缩写 BIER BU SOUS 
10? 28 yotta Y 从 eight 的 希腊 语 okto 中 转化 而 来 
10?! 279 zetta Z 从 seven 的 希腊 语 hepta 转 化 而 来 
105 29 exa E 从 six 的 希腊 诸 hexa 中 转化 而 来 
105 25 peta P 从 five 的 希腊 语 pente 中 转化 而 来 
10"? 2^ tera T 从 monster 的 希腊 语 teras 中 转化 而 来 
10? . 2? giga G 从 giant 的 希腊 语 gigas 转 化 而 来 
106 27 mega M 从 large 的 希腊 语 megas 转 化 而 来 
103 2) kilo K 从 thousand 的 希腊 语 chilioi 中 转化 而 来 
107^ milli m 从 thousand 的 拉丁 语 milli 中 转化 而 来 
1075 micro u 从 small 的 希腊 语 mikros 中 转化 而 来 
107? nano n 从 dwarf 的 希腊 语 nanos 中 转化 而 来 
107" pico p 从 little 的 西班牙 语 pico 中 转化 而 来 
1075 femto f 从 15 的 德语 和 挪威 语 femten 中 转化 而 来 
107! atto a 从 18 的 德语 atten 中 转化 而 来 
107?! zepto z 从 seven 的 希腊 语 hepta 中 转化 而 来 
107% yocto y 从 eight 的 希腊 语 okto 中 转化 而 来 





E.2 标准 ASCII 编 码 


表 E-2 标准 ASCII 编码 





字符 ”十进制 ”十 六 进 制 | 字符 ”十进制 TRER IFE TEBO HARAR | 字符 ”十进制 ”十 六 进 制 


nul 0 0 48 30 
soh 1 1 49 31 
stx 2 2 50 32 
etx 3 3 51 33 
eot 4 4 52 34 
enq 5 5 53 35 
ack 6 6 54 36 
bel 7 7 55 37 
bs 8 8 56 38 
ht 9 9 57 39 
if 10 : 58 3A 
vt 11 ; 59 3B 
ff 12 < 60 3C 
CT 13 = 61 3D 
SO 14 > 62 3E 
? 63 3F 


z 
— 
tA 
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E.3 





符 十进制 


六 进 制 


表 E-3 


, 


TH 75000 759 t$ 


i 


转化 为 十 进 制 


512 

1 024 

2 048 

4 096 

8 192 

16 384 

32 768 

65 536 

131 072 

262 144 

544 288 

1 048 576 

1 073 741 824 
4 294 976 296 


二 进 制 的 表示 范围 





字符 十 进 制 十 六 进 制 | 字符 十进制” 十 六 进 制 
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(5) 
字符 ”十进制 ”十 六 进 制 
P 112 70 
q 113 71 
r 114 72 
S 115 73 
t 116 74 
u 117 75 
v 118 76 
w 119 77 
x 120 78 
y 121 79 
z 122 7A 
{ 123 7B 
| 124 7C 
! 125 7D 
~ 126 7E 
del 127 7E 
近似 值 
IK 
2K 
4K 
8K 
16K 
32K 
64K 
128K 
256K 
512K 
1M 
1G 
4G 


